Europaisches 
Patentamt 



European patent 
Office 



urn 



. J^ff 5 ®* 0 0 7 FEB 2005 . 




2 4 07 2003 




Bescheinigung 



Certificate 



Attestation 



Die angehefteten Unterlagen stimmen 
mit der ursprungllch eingereichten Fas- 
sung der auf dam nSchsten Blatt be* 
zeichneten internationalen Patentan- 
meldung Oberein. 



The attached documents are exact 
copies of the international patent appli- 
cation described on the following page, 
as originally filed. 



Les documents fixes a cette attestation 
sont conformes a la version initiatement 
deposee de la demande de brevet inter- 
national specifies a la page suivante. 



Den Haag, den 

ShSR M OCT 2003 



PRIORITY 
DOCUMENT 

SUIIMI l"l i l> 0\< TRANSMITTED IN 
COMl'I.IAKii WITH RIM J: 17.1(a) OR (b) 



Der President des EuropSlschen Patentamts 
1m Auftrag 

For the President of the European Patent Office 
Le President de POfflce europeen des brevets 
p. o. 




C.A.J.A. PASCHE 



Patentanmeldung Nr. PCT/EP 02/1 0536 
Patent application no. 
Demande de brevet n° 



EPA/EPO/O^B Form 1214 (H) 09.82 



Blatt 2 der Bescheinigung « 
Sheet 2 of the certificate 
Page 2 de Pattestation 



Anmeldung Nr.: 
Application no.: 
Demande n°: 

Anmelder: 

Applicants): 

Damandeur(s): 



PCT/EP 02/10536 

1. PACT XPP Technologies AG - Munchen, Deutschland 

2. VORBACH, Martin - Munchen, Deutschland (nur US) 

3. BRETZ, Daniel - Munchen, Deutschland (nur US) 



Bazeichnung der Erfindung: 
Tit la of the invention: 
Tltre de linvention: 

Rekonfigurierbare Elemente 



Anmeldetag: . 
Data of filing: 
Date da depot: 

In Anspruch genommene Prioritat(en) 
Priority(ies) claimed 
Priarite(s) revendiquee(s) 

stafa: Deutschland 
Pays: 



19. September 2002 (19.09.2002) 



J^-September 2001 
d^.09.2001) 



Aktenzeichenjoj 46 132 .1 
, File no. 
Nurnero de depdt: 



Benennung von Vertragsstaaten : Siehe Formblatt PCT/RO/101 (beigefOgt) 
Designation of contracting states : See Form PCTyRO/101 (enclosed) 
Designation d'etats contractants : Voir Form ulai re PCT/RO/101 (ci-joint) 



Bernerkungen: 

Remarks: 

Remarques: 



Weitere Prioritatsanspriiche: 



Vereinigten Staaten 
von Amerika 

Europe 
Europe 



28. September 2001 
(28.09.2001) 

30. September 2001 
(30.09.2001) 

08. Oktober2001 
(08.10.2001) 



09/967,497 



PCT/EP 01/11299 



PCT/EP 01/11593 



Ef»A/ePO/OE8 Form 1012 Q2.B9 



Deutschland 



Europe 

Europe 

Deutschland 

Deutschland 

Deutschland 

Deutschland 

Deutschland 

Deutschland 

Deutschland 

Europe 

Europe 

Europe 

Deutschland 

Deutschland 

Deutschland 

Europe 

Deutschland 




05. November 2001 
(05.11.2001) 



14. Dezember2001 
(14.12.2001) 

18. Januar2002 
(18.01.2002) 

15. Februar2002 
(15.02.2002) 

18. Februar2002 
(18.02.2002) 

18. Februar2002 
(18.02.2002) 

21.Februar2002 
(21.02.2002) 

21.Februar2002 
(21.02.2002) 

27. Februar 2002 
(27.02.2002) 

27. Februar 2002 
(27.02.2002) 

05. Marz 2002 
(05.03.2002) 

05. Marz 2002 
(05.03.2002) 

05. Marz 2002 
(05.03.2002) 

21. Marz 2002 
(21.03.2002) 

21. Marz 2002 
(21.03.2002) 

02. Mai 2002 
(02.05.2002) 

02. Mai 2002 
(02.05.2002) 

12. Juni 2002 
(12.06.2002) 




01 129 923.7 

02 001 331.4 
102 06 653.1 
102 06 857.7 
102 06 856.9 
102 07 224.8 
102 07 226.4 
102 08 435.1 
102 08 434.3 
PCT/EP 02/02402 
PCT/EP 02/02403 
PCT/EP 02/02398 
102 12 622:4 
102 12 621.6 
102 19 681.8 

02 009 868.7 
102 26 186.5 



Deutschland 

Deutschland 

Deutschland 

Deutschland 

Deutschland 

Deutschland 

Europe 

Deutschland 

Deutschland 

Deutschland 

Deutschland 

Deutschland 



20. Juni 2002 
(20.06.2002) 

07. August 2002 
(07.08.2002) 

21. August 2002 
(21.08.2002) 

27. August 2002 
(27.08.2002) 

27. August 2002 
(27.08.2002) 

03. September 2002 
(03.09.2002) 

09. September 2002 
(09.03.2002) 

06. September 2002 
(06.09.03) 

07. August 2002 
(07.08.2002) 

21. August 2002 
(21.08.2002) 

07. August 2002 
(07.08.2002) 

21. August 2002 
(21.08.2002) 



102 27 650.1 
102 36 271.8 
102 38 174.7 
102 40 022.9 
102 40 000.8 
PCT/DE 02/03278 
PCT/EP 02/10084 
102 41 812.8 
102 36 272.6 



102 38 173.9 



102 36 269.6 



102 38 172.0 



Fcld Nr. V BE^TMJM^^V^ 



' +49 V2i 469308 S . 04/63 

BjattNr. .3.- ^ 1 ^L^dU^J^Z 
I e entsprcchaxfm Kastclm anfi&e&r; vmg&ns tin Kasttlten mutt mrnkrewi \e*nh 



Die folgendsa Bestunmungen nach Regel 4.9 Absatz a wentea hfomit vorgeuommeu: 
Regionales Patent 

S A? AIUPQ-Patent; GH Ghana, GM Gambia, KE Kenia, LS Lesotho, MW Malawi, MZ Mosajabifc, SB Sudnn 
SLSicnaLeone f SZSwa5alandL,TC Uganda,ZM Sambia,ZW Sixnbabwe uad j<nJka^itei^ 

Staat, der Vertragsstaat des Hamre-Prgtokoils mid des PCT ist (falls due atdem Scfwtzreditsart oder em wntffeey Veifafiren 

gewunschtwird, bitte^dergepzmkt^nLmiscmgdim) 

SI ISA Eurasfeclies Patent; AMAnnenien, AZ Asertaidschan, BY BcIaro^-KGKirgisisrda, KZ Kasachstea, MDtemibl& 
Moldau, RU Ruasiscbe Federation, TJ Tadschikisian, TM Twrkmeuiatau wd joder weitere Staat, der Vcxttagsstaat des 
Eurasischen Patentubereiukommeas und des FCT ist 
E? Earopafcches Patent; AT OsteircidL, BE Belgian, BG Bulgaria, CH &LI Schweiz und Liechtenstein, CY ZypciD, 
CZ Tschcchische Republic »E Deitfschlaud, DKDSneiaaik, EE EsdanO/ES Spauiea, FI Finnlaud, FR Frankrefcb 
GB Vercinigtes KSnigreicb, OR Griechenland, EE Irlaad, IT Italien, LU Luxemburg, MC Monaco, NL NiederfeaOe! 
FT Portugal, SE Scfaweden, SK Siowatei, TR Turkci und jedcr weitcre Staat, der Veitragsstaat des Europaischen 
PatentQbcrciokoinmeus und des FCT ist 
E3 OA O AFI-Fatent: BF Burkina Faso, BJ Benin, CF Zfmtralamkaoische Repubiifc, CG Kongo, CX Cflte d"Ivoin?, CM Kameren 
GA Gabun, GN Guinea, GQ Aquatorialgoinca, GW Guinea-Bissau, ML Mali, MR Maurctanien, NE Niger, SN Senegal 1 
TO Tsohad, TG Togo und jeder weitwc Staat, der Vertragssiaat der OAPI und des FCT ist (fails eine andenzSchutznxJusart 

odereinsotistiges V irfaknzi gewitnscla \vird> biite auf dergeptaikietm Uiug cmgeben) 

Nationals Patent (falls eine aitdere SdlutzrvdUmnoderein spnstigex Veifahnm s*™uis<JiiiyuxL btoecvfdergepw 

g AE Vcrcinigte Arabischc Enrinue H GM Gambia EI rra Neusseland 

AG Antigua und Barbuda 0 BR KroaUen ^ OMOroan 

m AL Albania Sl HU Ungan>' S FH Philippincn 

AMAxmenicn... El IB Indonesia 0 PL Folcn ... 

g AT Ostetreigh.ayph^ 0IL Israel.. f& FT Portugal 



i ATU MBtranen IN Indi OT El RO Rumanien 

i ^ Awrtaidsdaa g IS bland S Bmsische Fftkiatfon . 

BA Bosaien.Hetzegovina fM JP Japan 

gj BB Barbados ISlKEKenia E3 S» ajdia" 

5^ ^ UisaiiCn S KG Kirsisistaa S SE Schwedsn 

!5j BR Brasdien EI Ki» DenioknUische Volksnsirablik EI SG Singapur 

1^®^ ^ Korea 13 SI SloSu 

^ BZ Belwe (gj rr Republik Korea EI SK Slowakei 

™ @ KZ Kasadistan ® SL Siwa Lco M 

^ CH & U Schwci* -und Liechtenstein S LC SaintLacia . 0 T J Tadsvhikbt«i .... 
raS!^: ^ LK Sri Lanka EI TM Tuikmeoistan .] 

^ CR Costa Rica HQ LS Lesotho S TR T^i 



S 35^ " S LT Ubwm E» TT TrinidwinndTotogo 

CZ TgchecIiiscueRepubHifc ISI LXJ Luxemburg 

| DI3 DewsoUand . .»m g ^ v Lelfland ^ Tz r,^^^ 

DK W^emaik 0 MAMawkto El UA Ukraiac 

pi DM ^n^ica EI Ml) RcpuWfc Molvlau Er UG Uganda ; . 

^ ^ J 186 " 011 ra S US VereimgteStaateivoa Anicrifca. . 

^ EC Ecuador m MGMadagaskar 

m m Estfand Bj| MICPw ehcmaligo jngoslawisohe 13 UZ. UsbeJrisfaH 

Cj ES S ^ Micn RepubKkMazcdonien El VN Vicinaiu 

^ FI Fiunland g| MNMongoIei |g| YU Juaoslawfeji .' 

M -G» Vereinigtes KQmsreich MW Malawi • MZA SMtfaka 

U GD Grenada ij jy^ Mesifa) ^ZM Sambia 

S^^S*^a2^*r^ ^ Hi,Cl1 ^ V «^^S dieses Formbtaur. boigetretcn siad. 

h :::::::::::::::::: a::::::::::::::::::::::::::;-":::" □ 



vSS*9 ffi h Sf »«8*i«ttm«ug«>; ZmfitzJich xu den oben genannten BestUnmnngen aimmtdia AaraoWcr nach 

V^iSr.w b !v (3,C3er «War«ng ausgenommra ainO. Der Anmeldererltfet, dsfl diegezusStzUchcnBeauanaungon Uftterdmn 
testtirtvS ZSS%^f$ m ^ jeiJe ZUfifilzU,;Ut: Beau-aunung, die v« Ablauf von 15 Monaicn ab (ten Prioritatsdatara aicbt 
nE AID f a n« «5 o ilmlO oT« iffp t! ? ? a!s rwn Amneltiw wrttekgeBtamnwa gilt (2?te JtetSUgtws (emsdttofllich der GebMihm) 



19-SEP-2002 16 : 37 

Akte: PACT 



PCT 



PflT.-fiNUI. P. PIETRUK 



+49 721 46930a S. 



03 



PW&02/ 10536 



Pat en t anmel dung 



10 



15 



20 



Anmelcier: pact XPP Technologies AG 
Muthmannstr. l 
D-80S39 MuncHen 



v ertreter: 



Titel: 



Patentanvalt 
Claus Peter Pietruk 
Heinrich-Lilienfein-Weg 5 
D- 762 2 9 Karlsruhe 
Vertreter-Nr. 321 605 

Rekanfigurierbare Elemente 



Prioritaten 



25 Definitianen 

w Slcft ln de » UnteransprSchen. 
ttoter einer refconf igurierbaran a rchi „ oU 

H TOi „ ter . r ™: r r ™ Ba ™ 

be^Qudere integrate Bau - • C Van «=»uiig verstanden, in3 - 

egr* erte BausteiRe mifc einer Mehraahi ^ ^ 



35 



Enpf.zeit:19/a9/2002 16:38 



16S3 7 PPT.^HU. P. PIETRUK ^ +4g m ^ g 0g 
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Stand der Technik 

tfnterschiedliche PAE-Strukturen sind nach dera Stand der Technik bekannt. 
Die gebrauchlichsten sind durcli DE 126 51 075.9-53 , DB 100 50 442 -S , 
sowie Chameleon CS2112 definiert. Weiterhin soil auf die bekannten FPQA- 
Zellen verwiesen we r den. 

Aus dem universitaren Umfeld sind Zellstrukturen wi<=> die DPGAs, RawMa- 
chine (rveHu.cn) , KressArrays (Kress, Uhi Kaisers lautern) , XPUTER (Hart en- 
stein, Uni Kaisers laut em ) , sowie weitere strukturen bekannt. 

Pie nachfolgend beschriebenen Erweiterungen, die f-dr alle vorgenannten 
Stmkturen nutzbar sind, verbessern die Nutzbarkeit der Architekturen 
und PAE-Strukturen in komplexen inebesondere auch stark sequentiellen 
und/oder wenig dafcenfluSorientierten Anwendungen . Weiterhin wird der An- 
schluS an externe Einheiten (z,B. Speicher und/oder Peripherie) verein- 
facht und haraogenisiert . 



Indirekte Konf iguration 

in einer besonderen Ausfuhrung einer PAE (IPAE) wird diese oder eine 
Gruppe von PASS niit einem Speicher (RRAM) , vorzugsweise einer RAM -PAE 
gekoppelt. Die IPAE weist einen eigenen intemen Sequencer anf oder ist 
mit einem Sequenzer bzw. Microcontroller mit einem bevorzugt limitier- 
ten, d.h. mit einer vergleichsweise geringen Anzahl an unterschiedlichen 
raoglichen Befehlen, ahnlich wie bei RISC-Prozessozren und/oder bevorzugt 
vollstandigen Befehlssatz (vgl . arc Microprocesaor) gekoppelt. Mit ande- 
ren Morten wird bevorzugt ein RISC Prozessor mit einem moglichst kleinen 
Befehlssatz, der jedoch berechnungstheoretisch vollstandig ist, verwen- 
det. in einer Ausfuhrungsvariante kann der Sequencer auch durch eine 
KonEiguration einer oder mehrerer PAEs gebildet werden. Es kann der Se- 
quenzer in seiner Funktion und seinem Ablaufverhalten konf igurierbar 
35 ausgestaltet sein (wie beispielsweise nach dem Stand der Technik be- 
kannt, s.B. durch EPS44S von Altera [ALTERA Data Book 19533). Der Se- 
quenzer/Microcontroller kann auf Zustande (z.B. Statussignale, Ereignis- 

3 
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se) in der ipae nnd/oder auf Zustande (z.B. auch Trigger) anderer PAEs, 
die ait der ipae verbunden sind ( z .b. uber ein Bu ssyst em) , reagieren. In 
einem Register der ipae wird ein Pointer auf einen RRAM Speicherinhalt 
konfiguriert, z . b . kann der ProgramPointer Rpp kann wahrend des Reset- 
Zyklus auf die Startadresse des Codes gesetzt werden. Ein Adressgenera- 
tor im seguenzer liest den durch den Pointer referenzierten Speicherin- 
halt ans dem RRAM «nd schreibt aiesen (oder einen Tell dessen) entweder 
xn ein, beispielsweise durch den Speicherinhalt adressiertes . Konfigura- 
txonsregister einer adressierten PAE oder nutzt den Speicherinhalt «i» 
lustration fur eine nachste verarbeitung. Der Pointer wird durch den 
Adressgenerator entsprechend der ubliehen Arbeitsweise vo n Adresspoin- 
tem inkrementiert und/oder dekrementiert und/oder bei Sprungbefehlen 

CM*. RETURN, neu gesetzt. Insoweit stellt der Speicher RRAM ei- 
nen Codespeicher una in einer bevorzugten Ausfuhruug a *ch Datenspeicher 
fur einen Seguenzer zur Verfugung und/oder wird als solcher genutzt. Der 
Seguenzer kann frei code aus dem Speicher (RRAM, lesen und in einer be- 
vorzugten Ausfuhrung auch Daten aus dem speicher lesen oder in den Spel- 
ler schreiben. Inscfern stellt der Speicher auch einen Datenspeicher 
fw den Setjuenzer dar. 

Der RRAM Speicherinhalt kann von einer uhergeordneten Konf igurationsein- 
hext (CT, geladen werd.n. Xn einer erweiterten Ausfuhrung *ann der Spei- 
cherinhalt. ggf . aw= h vo„ der XPAB selbstandig, zusatzlich oder alterna- 
te aus einen, anderen (beispielsweise e^ernen, speicher geladen oder an 
dxesen geschrieben werden, z.B. uber einen Anschlu* an ein Frontend. 

in einer Ausfuhrnngsvariante kann der Speicher und/oder die ipae ein.n 
dxrekten Auschlu* ( BXX Btxs, an ein ^temes ram und/oder externe 10 be- 

Ia e±ner ***** beSOnd *" bevorzugcen Ausgestaltung kann der EXT- 
BUS uber eine, ggf. dedi si erte, Verbindung des PAE-Bussystems an eine 
Interface-Baugruppe (IOAO) wie heispielsweise aus p ACT03 oder PACT15 be _ 
kannt realisiert sein. Die Ansteuerung von Speicher (RAM, wd/oaer Peri . 
Pherie (») erfolgt dabei bevorzugt durch die Interface-Baugruppe. 

in einer hescnders oevorzugten Ausge sta l tuilg Jcann der RRAM selbstandig 
Code und/oder Daten fur den Seguenzer Ober den BXTBUS aus den, oder eine. 
extemen RAM laden. Diese ^..-v^.^ 

cxese Funktxcn kann durch eigenstandige , im RRAM im- 

*■ —t 
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plenientierte oder itnplementierbare Adressgener stolen realisiert w er den. 
Be iS pi el5 wei S e eignen sich DMA-Kontroller besonders fur diese Aufgabe, 
indem sie blockweise Daten zwischen den Speichern kopieren. Der Adress- 
raum der zu lesenden Daten und der Zieladressraum wird entsprechend ge- 
5 setzt und der Kopiervorgang wird gestartet. Das Setzen kann durch die 
IPAB erfolgen. 

In einer hardwaremafiig aufwendigeren L6sung kann die Funktion durch eine 
impleraentierte MetnoryManagen,enXJnit (MMD) realisiert sein, deren allge- 
«0 tneine Funktionsweise durch den Stand der Technik per se definiert und 
bekannt ist. Vorliegend arbeitet die bevorzugte MPtU hier wie folgt: 

Der der MMtr verwaltete Rram Speicher 1st in mehrere Seiten (Pages) 
aufgeteilt. or e de Page enthalt Daten eines virtuellen Speicherraun.es in- 
15 nerhalb eines externen Speichers. Beispielsweise konnen die hexadezima- 
len RRAM-Adressen QxOaOO . . OxOaf f Daten des externen Speichers an den 
Adressen Oxbd^oo . . 0xbdl32f f enthalten. zur Verwaltung der Adressumset- 
zung wird eine Adressubersetzungseinheit verwendet, die vorzugsweise 
durch in der KRAM-2elle vorgesehene lookup -Tabelleu realisiert is t Die 
20 mo ist nun dazu vorgesehen, insbesondere einen groSan Speicherraum auf 
den sehr viel Kleineren des ream 2U ubersetzen. Dies geschieht vorlie- 
gend derart, dass Seiten j. nach Bedarf von dem gro£en Speicherraum in 
den Kleinen kopiert werden. sobald eine Seite nxcht meur benotigt wird 
kann dieae geloscht und/odar uberschrieben werden. wenn die Daten auf 
der Seite grander* wurden, wird die Seite bevorzugt vor den, L6 - 
schen/eberschreiben in den groSen speicherrraum zuruckgeschrieben. 

Die Adressumsetzungseinheit arbeitet dann derart, dass ein hoherwertiger 
Teil der physikalischen Adresse (also die Adresse der Seite) in dem Loo- 
kup-speicher abgelegt wird und auf die entsprechendea Daten der Seite i« 
RRAM zeigt, sobald die Seite innerhalb des kleinen Speichers (RRAm) ver- 
fugbar ist. Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die 
Sexte in, rr**, lst auch keine eingetragen . Jn ^ ^ 

dxe Sexte erst von einen, grofien (externen) Speicherraun, in den RRAM ko- 
piert werden. Hierzu kann eine andere, bevp rw3t akcue il „i cht verweIlde . 
te Seite gemafi dam vorstehenden Ablauf uberschrieben werden 
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Das Kopieren kaun dabei automatisiert. also ohne wesentliche Beteiligung 
durch den Sequent erfolgen. indem von der MMC ein DMA- Kont roller ange- 
steuert wird. Die erf indungsgemaSe MMU des hier offenbarten RRAM ist da- 
her mit einer Ansteueruug fur einen DMA-Kontroller versehen und/oder 
^erbindbar. ciesem werden die entsprechenden Seitenadressen im REAM und 
externen RAM. sowie die Seitengr6Se durch die MMTT zur Verfugung ge- 
stellc, B . B . indem sie in Register eingetragen werden. 
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10 in einer mogliohen und applifcacionsabhangig ggfi. bevorzugten AusfOhrung 
kdnnen mehrere EXTBDS-mterf ace implemantierc sein. 

In einer moglichen Ausfuhruag ist der RRMI ^ mehrerQ Se9mente unter _ 
teilt, die in unterschiedlichen Adressbereichen liegen. Die Segments 
15 Hoanen beispielsweise fur einige dar folgenden Funkcionen aufgetei lt 

sein bzw. aufteilbar sein und iasbesoudere eine GrSfie aufweisen. die die 
Knplemeatierung aller Oder einiger der folgenden Funktionen ermoglicht 
sowie entsprechende steuerungen, aie gegebenenf alls konx igurierbar Sijl d 
bevorzugt aber fast implementiert sind, besitzen: 
20 Seguenzer-ZCcde-Speicher, stack { ..». fur Registersatz, , Datenspeicher, 
Heap. IO-Puffer. Puffer zu externem RAM bzw. Cache, Lookup-Tabellen, 
Koufigurationen fur PAEs und/oder Busse, der Registersatz der ipae 
■le aaoh Funkcion konnen dasu folgende Ansteuermechauismen vorgesehen 
und/oder kanf iguriert sein: 

25 Seguenzer-/code-speicher : Programmer auf die entsprechenden Spei- 
cherstelien (Rpp) _ 

Stack: Stackzeiger auf die oberste Speichers.elle des stack (Rsp, , gege^ 
benenfalls auch ein FramePointer (Rfp, , wle S r nach dem stand der Tech- 
xxak (z . B . Intel Pentium) per se bekannc ist 
<■ Konfigurationen fur PAEs und/oder Busse: Hierauf kaan ein Zeiger inner- 
haXb der er und/oder - implementierungsabh^ngig ein 2eig er innerhalb der 
Konfx 3 urationssteuerun 3 der PAB zeigen. - 

Registersatz der ipae, Sollte der Register der PAE i m speicher un- 
tergebracht sein. wird dieser direk* durch die PAE bevorzugt hardvare- 
techaisch £e St VO rgegebenen adressiert. 
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Die restlichen Speicherbereiche, wia Datenspeicher, Puffer, Tabellen 
etc. werden typischerweise und bevorzugt durch den Compiler Oder Pro- 
grammierer aufgebaut. Die Adressierung dieser Bereiche erfolgt durch das 
auszufuhrende Programra und/oder Betriebssystem und wird innerivalb des 
Programmes und/oder Betriebssystems, ggf . outer Zuhilfenahme der Regi- 
st ersatzes und der ALU des Seguenzers, berechnet. 

Der Registersatz der IPAE kann in einer besonderen Ausgestaltung thnlich 
dem Registersatz von Transputern als Stack ©rganisiert sein. Dadurch 
kann der Registersatz besonders klein und hardwaratechnisch effizienfc 
raalisiert werden (typischerweise reichen 3 Register A, B und C aus) . 
weiterhin ist aus der Transputertechnologie bekannt, dass compiler effi- 
zient rait einem derartigen hardwaretechnisch kostengunstigen Register- 
satz arbeiten konnen. Ebenfalls kann der Registersatz optional im RRAM 
15 liegen. 

In einer AusfOhrung kann und wird der rram als Multi-Port Speicher aus- 
gefuhrt sein- Multi-Port Speicher erlauben den ggf. auch gleichzeitigen 
Schreib- und/oder Lese-zugriff durch mehrere Speicherzugrif fseinheiten 
auf den Speicherinhalt . Speicherzugrif fseinheiten k6nnen beispielsweise 
externa und/oder interne Peripherie, Prozessoren, andere PAEs sein. Die 
Punktion von Multi-Port Speichern ist nach dem stand der Technik eben- 
falls bekannt. 

25 Xn einer besonderen Ausfuhrung kann die IPAE mit dem REAM als lokale und 
ggf. auch globale Konf igurationseinheic ahnlich einer CT fur PAEs in der 
tTmgebung arbeiten oder unter anderem diese Funk t ion mit erf alien. Bevor- 
zugt arbeitet die PAE nach dem aus DE 196 54 846.2-53 bekannten Verfah- 
ren bei der verwendung als lokal Konf igurationseinheit . Wird die PAE als 

30 globale Konf igurationseinheit verwendet, Oder sind sehr viele lokale 
PAEs zu konfigurieren, wird bevorzugt das verfahren nach DE 19S 54 
593.5-S3 verwendet, das eine FILMO-Funktionalitat aufweist und daiier 
sehr viele und auch voneinander unabhangige Konfigurationen verwalten 
kann. 

35 Die IPAE adressiert, z. B. jesteuert durch den Spenser/ Microcontrol- 
ler, Konfigurationen im RRAM und konfiguriert diese an PAEs und/oder 
sich selbst und/oder bestimmt den Ablauf des Sequen- 
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zers/Microcontrollers. Bevorzugt findet hierbei eine Synchronisation ruit 
einer ubergeordneten CT ahnlicb der bekannte inter-CT-Protokolle (DE 198 
07 872.2, DE 100 28 397.7 , DE 199 26 538.0 , state. Die IPAE REAM 
Schaltung W Konf iguration uber eines der EXTRAM-Xnterf aoe selbst 1*- 
> den und/oder Konf igurationen von einer ubergeordneten CT uber das CT In- 
terface anfordem. Die Funktionsweise kann ahnlich der Reconfigurations. 
einh.it in de i* 6 s* 846.2-53 sein. Die Konf igurationsdaten fur die 
PAES Werd6n dUrCl1 flie IRAM ™ PAE S weitergeleitet oder in einer be- 
vorzugten Ausgestaltung direkt von RRAM. Zur Aufteilung dar Daten in. 
» R*AM an n.^e.e PAE s *ann dabei ein Busverteilverfahren ahnlich des in 
DK 101 10 53 °- 4 ^teiebenen SIMD-Bussystema verier warden. 

Hit anderen Worten ist die prinzipielle Arbeitsweise einer ipae rram 
Verschaltun* ahnlich einen, Microooncrollersy-ste*. dessen Busanbindung 
und/oder dessen Datentransfer und/oder dessen Progran,mablauf einem vpu- 
System entspricht. 

Bs wird i^besondere Schutz f^ IPAE-RRAH-Verschaltungen beansprucht 

TJT^ IPAE ^ *" jCWe±1S ^ S ^ ate ^tionsala^ante 

(PAEs) eines rekonf igurierbaran Bausteins aus^estaltee sind und typi- 
scherweise beliebige Verschaltungen und Funkticnen ausfuhren konnen 
abar jadooh spesiell zum Einaatz dar erf indu^sgen** beschriebenen se- 
quen 2 e rst ruktur aus IPAB und RRAM entsprechend konfiguriert und verwen- 
dat .erden *6nnen. Die Konf iguration erfoigt dabei bevorzugt durch dia 
ubergeordnete Konf igurationseinheie er. 

Ebe nfalls wir a Schutz beansprucht fur PAEs, die ^.lich zu ihra m An- 
schluss an dia internen Bussyste me das teraya aus PAEs ^ dedisierfcen 
Anschluss (xo-channal, an ain uberregionales Bu SSystem auf^eisen, das 
xnsbesondare Daten uber langa strecKen innerhalb da S Arrays Obertragt 
-Voder insbesondere direkten Anschlu* an die Peripherie aufweist. Der 
Anschlu* an die Paripherie fcann dabei direkt erfol.en, inde. ,. B. das 
Bussyste, bereits den, pe.iphereu P.otokoll entspricht odar uber entsp.e- 
chende Protofcollwandle, zur UmS etzung das Protokolls er fol g en. Das dadi- 

TMTTZ ^ dabei b ^ itS eiaem antsprachaa, 
. ™». Hthernat. b^ds, ddk^ etc. m so - 

exnan a.nfachan und unaufwendigen Anschluss der periphery Ger4t6 ^ 
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ermoglichen. Gegebenenfalls konnen auch in zwischengeschalteten lOAGs 
(vgl, PE 136 54 595.1-53 ) ProtokollKonvertierungen derart durchgefuhrt 
werden, so dass ein internes vereinfachtes und ggf- proprietares Buspro- 
tokoll auf ein oder mehrere komplexere externa Standardpro toko lie uber- 
setzt we r den . 

Es soil besonders darauc; hingewiesen- werden, dass unter Peripherie auch 
Speicher vsrstanden werden, wie bei den bereits aufgezahlten Busproto- 
kollen verdeutlicht wird. 

Ebenfalls ist erf indungsgeraafi besonders relevant, dass PABs audi mehrere 
Anschlusse an dedi2ierte Bussysteme aufweisen kannen. 



Desweiteren sind anwendungsabhangig auch Architekturen sinnvoll, bei de- 
nen nur eine Teilmenge der FAEs Anschlusse an ein dediziertes Bussystetn 
15 aufweist, oder unterschiedliche PAEs mifc einer unterschxedlichen Anzahl 
von Anschlussen an ggf. auch unterschiedliche dedisierte Bussysteme auf- 
weisen. 



Ira folgenden wird eine detaillierte Beschreibung einer Ausfuhrungsvari- 
aixte der erf indungsgemafcen Kopplung v Qn IPAE und RjRAM ausgefuhrt: 

Es wird erfindungsgemafc bei einem in Punfction und/oder vemetzung ins- 
besondere zur Laufzeit ohne Storung nicht zu rekonf igurierender Elements 
rekonfigurierbaren Zellelementefeld zur Dateuverarbeitung mit Funktions- 
sellen zur Ausfuhrung algebraischer und/oder logischer, konf igurierbarer 
Funktionen und Speicherzellan, urn Informations zu empfangen, abzuspei- 
chern und/oder auszugeben vorgeschlagen, daS eine Steuerverbindung- (CMP) 
von den Funktionszellen zu den Speicheirzellen gefuhrt ist. Diese steuer- 
verbindung dient dazu, die Adress^ und/oder Datenein/ausgabe aus dem 
Speicher durch die zugeordnete Funktionszelle, typisch einer ALU- PAE , 
steuerbar zu machen- So kann etwa angegeben werden r ob die nachste uber- 
tragene Information als Adresse oder als Daten behandelt warden soli und 
ob ein Lese- und/oder Schreibzugrif f erforderlich ist. Diese Datenuber- 
tragung aus der Speicherzelle, bei der es sioh etwa urn eine RAM- PAE han- 
deln kann, auf die ALU -PAE erlauben dann, da£ neue, vyzi der ALU abzuar- 
beitende Befeble in diese geladen werden konnen. Es ist auf diese Weise 
moglich, lediglich durcn vorsehen einer dedisierten und dedisiert funk- 
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tionszellenkontrollierten Steuerverbindung zwischen Funktionszelle und 
Speicherzelle bereits mit uur swei Element en, die fiber geeignete Busse 
verbunden sind, eine Seguenzerstruktur in einera Zellelementefeld auf zu- 
bauen, obne dafi ansonsten weitere MaSnahmen una/oder baulicbe Veranda - 
5 rungen erforderlicb sind. In der Speicherzelle fconnen Daten, Adressen, 
Programmschritte usw. in per se aus herkSmmlichen Prozessoren bekannter 
Weise abgelegt werden. Weil beide Elemente auch in anderer Weise bei 
entsprecbender Konfiguratiou einsetzbar sind, ergibt sich eine besonders 
effiziente Bauweise, die sowohl Seguenzerstrukturen als audi vektoriel- 
10 len und/oder pa- rallelisierbaren Strukturen besonders gut anpafibar 
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ist. 



ES ist einsiobtig, daS durofa die Verwendung von lediglioh zwei Zellen in 
einem Zellelementefeld, aamlich der Funktionszelle und der Informations- 
bereitstellungszelle eine Vielzahl von seguenzerartigen strukturen in 
dem rekonfigurierbaren Zellelementefeld aufgebaut werden kann. Dies ist 
insofern vorteilhaft, als oftmals bei der Datenverarbeitung, etwa in ei- 
nem multitaskingfahigen Betriebssystem, eine Reihe unterschiedlicber und 
voneinander per se versobiedener Aufgaben abgearbeitet werden muB. e s 
kSnnen dann eine vielzabl derartiger Aufgaben in einem einzigen Zellele- 
mentefeld effektiv gleichzeitig abgearbeitet werden. Pie Vorteile fur 
Echtzeitanwendungen sind off ensichtlich. weiter ist es auob moglich, die 
einzelnen Seguenzerstrukturen, die in einem Zell- elementefeld unter 
Vorsehung der erf ind«ngsgemaSen Steuerverbindung aufgebaut werden, mit 
unterscbiedliohen Taktraten zu betreiben, etwa urn den Stromverbrauch da- 
durch zu senken. daS Aufgaben mit geringerer Prioritat langsamer abgear- 
beitet werden. Bs ist uberdies moglich, bei der Ausfiihrung per se weit- 
srehend paralleler Algoritbmen seguenzerartige Programmteile in dem Peld 
parallel Oder vektoriell abzuarbeiten und uragekebrt. 

Das Zellelementefeld mit den in Funktion und/oder vemetzung konf igu- 
rierbaren Zellen kann einsichtigerweise einen Prozessor, einen Coprozes- 
sor und/oder einen Mikrocontroller bilden, bzw. eine parallele vielzahl 
Oder Kombinationen derselben. 

Die Funktionszellen sind typisch als arithmetiscne Logikeinbeiten gebil- 
det, wobei sie insbesondere grobgranulare Elemente darstellen, die aber 

10 
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mit einer feingranularen Statemachine versehen sein k&men. In einem be- 
sonders bevorzugten Ausfuhrungsbeispiel handelt es sich bei den ALUs urn 
sogenannte erweiterte ALUs (EALU) , wie diese in den f ruheren Anmeldungen 
des vorliegenden Anmelders beschrieben wurden. Eine Erweiterung kann 
insbesondere die Steuerleitungskonerolle, Bef ehlsdekodiereinheit etc. 
urafassen, soweit erforderlich. Be soil darauf hingewiesen werden, dass 
grundsatzlich zumindest eine Teilraenge der Funktionszellen auch aus 
feingranularen FPGA-Elementen aufgebaut sein kann. 

Die Speiobersellen konnea Daten und/oder Xnxorraationen fluchfcig und/oder 
nichtf luchtig speichern. wenn in den Speicherzellen abgelegee Informa- 
eionen, seien es Programmschritte, Adressen fur einen Zugriff auf Daten 
Oder regis terar tig bzw. heap-artig abgelegte Daten als fluchtige Daten 
abgelegt sind, so kann eine vollstandige Rekonf iguration wabrend des Be- 
criebes erfolgen. Alternativ ist es moglich, nichtf luchtige Speicherzel- 
len vorzusehen. Die nichtf luchtigen Speicherzellen konnen etwa a l s ee- 
From-Bereich und dergleichen vorgesehen werden, in die ein rudimentares 
Bios-Programm abgelegt wird, das bei Inbetriebnahme der Anordnung auszu- 
fubxen ist. Auf diese Weise kann ohne weitere Bauteile eine Inbetrieb- 
nahme einer Dafcen^erarbeitungseinrichtung erfolgen. Bin nichtf luchtiger 
Datenspeicher kann auch dann vorgesehen werden. wenn aus Kpsten- und/der 
Raumgrunden beschlossen wird, dafi immer wieder dieaelben Programtnteile - 
auszufuhren sind, wobei dann auch unter solchen festen Prograunmteilen, 
etwa nach Art der WAVE - Rekonf iguration , ira Betrieb gewechselt werden 
kann. Die Moglichkeiten. darartige nichtf liichtige Speicher vorzusehen 
und zu verwenden, sind Gegenstand anderer Schutzrechte des Anmelders. Es 
ist mSglich, sowohl fluchtige als auch nichtf luchtige Daten in den Spei- 
cherzellen abzuspeichern, etwa urn ein Bios-Programm fese abzulegen und 
die Speicberzelle dennoch fur andere Zwecke nutzen zu konnen. 

Die Speicberzelle ist bevorzugt so ausgebildet, daS sie eine hinreichen- 
de Vielzahl von zu verarbeitenden Daten und/oder abzuarbeitenden Pro- 
grammteilen speichem kann. Es sei dabei darauf hingewiesen, daS diese 
Programmteile sowohl als Programmschritte ausgebildet sein kdnnen, die 
jeweils vorgeben, was eine einzelna, insbesondere die zugeordnete PAE, 
also insbesondere die die Speicberzelle steuernde Funktionszelle, im ' 
nachsten Schritc zu tun hat, als auch ganze Konf igurationen fur Feldbe- 

11 



Empf.zeit 119/09/2002 16:39 



Fmpf .nr.:flRR P.fllR 



19-SEP-2002 les33 ^fiT.-^NU. P. PIETRUK A +4 9 721 469308 S 13 

"—3^ W 



Akte: PACT3 



10 



15 



20 



25 



30 



reiche Oder andere Felder beinnalten ton. rn einem solchen Pall ist es 
ohne weiteres mSglicb, daJ5 die aufgebaute Seguenserstruktur einen Befehl 
ausgibc, auf Grund deasen eine Rekonf iguratio* vcn Zellelementef eidbe- 
reiahen errolgt. pamit arbeitet die diese Konf iguration ausldeende Funk- 
tion SZ elle dann.zugleicn ala Ladelogik (CT) . Es sel 

dafi die Konfiguration von anderea Zellen wieder™ dergestalt erfolgen ' 
kann, daS dort eine seguen^rarnige Datenverarbeitung erfolsrt ^ es ±Bt 
in diesen Feldern wiederum raoglich, andere Zellen im Varlauf dar Pro- 
graK.marbeitung 2 u konf iguriereu bzv. rekonf igurieren . Damit ergibt slch 
ein iterative* Konfi^ieren von Zellelementebereicnen und ain Ein- 
3Chadlteln VOT * ro 3~<^ mit Sequent- und Parallel-strukturen, die 
ahnlich ineinauder geecnachtelt sixxd wie eine Babuscnka. Ea Sei daraiif 
ningewiesen. dafi hier insbesondere durch Bin-Ausgabeaellen ain Zugriff 
auf waicara Zellelementefelder aufierbalb ein es ein.elnen integrierten 
Bausteines erfolgen kann, wa S dia Geeamnrechenleistung ^saiv erhohen 
kMm - ES ±St inSbeSOndere bei Auftreoan von Konf iguratrionen in 

einem Codeteil in ein Zellelementefeld nineinkonf iguriertan se- 

guenzerstruktur gegebenenfalls entweder dia Konf igurationsanf orderungen 
auf einem ^ieaenea Zellelementef eld, dea von der 3 aweiligen Seguen- 
ZerStrU " tUr alle±n -«~l*«fc -ird, durchzufuhren und/odar e S fconnen dez- 
artige Anf orderungen an aina Konfigurations-Mastereinheit abgegeben wer- 
den. um sicherzustellen. da* eine glaichmafiige Belegung allar Zellele- 
mente£elder er£ ° l3t - Es «* ibt ^mit ein tmterprogrannnaufruf- 

durch Ubergabe von erforderlichen Konf igurationen an Zellen odar Ladelo- 
giken. Diea wird f*r sich al S achutzwOrdig angeaehen. Es S ai auch darauf 
bingewiesen, da* die Zellan, S o fern sie selbst fflr die KouCiguration 
^ Zel ^l^tfeldbereicha Zustandigkeit besi tZ en, mit hard- odar 
.ofcwareartig impla^iextan Fll^o-Strukturen und dergleichan 2 ur si- 
cners.ellung einer ordnungagemaJSen Retonf iguration versehen aein konnen 
Auf die M 6glionkai t , die Spaiche^ellen wanrend de. Abarbeitung von Be-' 
fehlen daraxt zu beaobreiben, dafi eion der ab.uaxbeitanda Coda b zw . das 
abzuarbaitende Program Sndart, sai ningew ieS en. Xn einar beeouders oe- 
vo rZ ugten Varianta iat diaae Art der Selbstmodif ikation (SM) aber durch 
61ne ents P" c ^de Steuerun* ubar dia Funk t io n 3 Z elle unterdruckt. 

Bs iat maglich, da B die SpeicherzeUe abgespeicherte infor^tion bier 
auf^die anateuerung der 5ie ateuernden Funkt:ion SZ elle dirakt Oder indi- 
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rekt auf einen zur Funktionszelle foihr en den Bus gibt. Die indirekte Aus- 
gabe kann insbesondera dann erfolgen, wenn beide Zellen benachbart lie- 
gen una die durch Ansteuerung angeforderte Information an die alu-pae 
fiber ein Bussegment eintreffen tnufi. das niche unmittelbar mit dem Aus- 
gang der speicherzelle verbunden werden kann. In einem solchen Pall kann 
die Speicherzelle Daten auf dieses Bussystem insbesondere uber Ruck- 
wartsregister (Backward-Register) ausgeben. Es 1st daher bevorzugt, wenn 
zumindest eine von Speicherzelle und/oder Funktionszelle ein solches 
Backward-Register aufweist, welches im Informationsweg zwischen Spei- 
cherzelle und Funktionszelle angeordnet werden kann. Diese Register 
brauchen in einem solchen Fall nicht zwingend mit weiteren Funktionali- 
Um VerBSllen sein ' «wa bei Anforderung von Daten aus der 

Speicherzelle fur die weitere Verarbeitung, entsprechend einem herkomn,- 
lichen LOAD-Befehl eines typischen Mikroprozessors, zur veranderung der 
Daten noch vor dem Hineinladen in die PAE ohne weiteres denkbar 1st, urn 
z- B. einen Befehl load++ zu realisieren. 

Mit anderen Worten werden innerhalb der beschriebenen Struktur Busver- 
bindungen bei Bedarf durch die in der XPP-Technologie des Anmelders ty- 
pischen Forward (FRBG) - und Backward (BREG) -Register gefuhrt. Diese besit- 
zen die M 6gli=hkeit Daten zwischen horizontalen Bussystemen vertikal zu 
Obertragen und konnen mehrere Busse multiple oder demultiplex. Der 
vollstandigkeit halber sein darauf hingewiesen, dass FRBG- und BREG (ent- 
gegen ihrer Namensgebung) nicht zwangsltuf ig Regis terstuf en darstellen 
sondern lediglich optional und ggf . konf igurierbare Register aufweisen 
Dxe Steuerverbindung (CMD) kann dabei an FRBG und/oder brsg der jeweili- 
gen Funktionszellen (PAEs) gefuhrt werden, um die Busdatantransfers ent- 
sprechend des aktuell ausgefuhrten Befehls zu steuern. 

Die Speicherzelle wird bevorzugt dazu angeordnet sein, Informationen von 
der sie steuemden Funktionszelle zu empfangen, wobei auch welter ein 
informationseinspeichern uber eine Ein-Ausgabezelle und/oder eine die 
Speicherzelle nicht steuemde Zelle moglich ist. Insbesondere dann, wenn 
Paten von einer Ein-Ausgabezelle in die Speicherzelle geschrieben werden 
solleu, 1st es bevorzugt, wenn auch diese Ein-Ausgabezelle (i/o-pae) von 
der Funktionszelle gesteuert wird. Dabei kann etwa die Adresse, bei wel- 
cher erne in die Speicherzelle zu schreibende oder gegebenenfalls auch 
direkt an die Funktionszelle (PAE) zu ubertragende Information zu lesen 
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ist, an die I/O-PAE von der ALTJ-FAE ubermittelt werden. Es sei in dieseuv 
Zusannnenhang darauf hinge wie sen, da£ diese Adreese Ober eine Adrefiuber- 
setzungstabelle (Adresstranslationtable) , einen Adresstranslationbuf fer 
Oder eine MMU-artige Struktur in der I/O-PAE festgelegt werden kann. Es 
ergeben sich insbesondere in einem solchen Pall die vollen Funktionali- 
cacen typischer Mikroprozessoren. 

Die Funktionssellen-Speicherziellenkombination ist demnach in einer be- 
vorzugten variants zumindest ein Ein-Ausgabe-Mittel zugeordnet, mib wel- 
cnem dann an eine extern* Einheit, eine andere Funktionszelle, Funkti- 
onszellen-Speicherzellen-Kom-bination und/oder Speicaersellen Informati- 
on gesandt und/oder von dieser empfangen werden kann. 

Die Ein-Ausgabe-Einheit wird dabei bevorzugt gleichfalls zum Empfang von 
Steuerbefehlen aus der Funktionszelle ausgebildet. 

Die Funktionszellen-Speicherzellenkombination weist bevorzugt Da ten - 
transfermdglichkeiten an die Sbrigen Funktionszellen und/oder Speicher- 
zellen eines vpxy-Bausteines auf, insbesondere solchen, die sich im Array 
aus PAEs (PA) befinden. Hierzu werden Zugrif f smoglicbKeinen fiber die 
Busayeteme auf die entsprechenden Zellen zur Verfugung gestellt. Der Zu- 
grif f erf olgt bevorzugt uber die Forward- und/oder Backward- Register der 
PAEe der Eunktionszellen-Speicherzellenkotnbination, durch die fibertra- 
gung der "Port" -5teuerkommandos. 



In einer be^orzugten Variants ist die Steuer^erbindung (cmd) dasu ausge- 
bildet, zumindest einige und bevorzugt alle der nachf olgenden Steuerkoro- 
tnandos zu ubertragen: 



OPCODE FETCH, 

1NTERNE/EXTERNE DATENSUGRIFFE, 

POSITIONIERWG VON INTERNEN/EXTERNEN ADRES SPO INTERN , 
POSITIONIERUNG VON IWTERNEN/EXTERMHN PROGRAMMPOINTERN, 
35 PROGRAMMPO INTER INCREMENT, 

POSITIONIERUNG VON INTERNEN/ EXTERNEN STACKPO INTERN, 
STACKZUGRIFFE ( PUSH, POP ) 
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read_Reg: 



Beispielsweise kann diese Funktionalitat durcn folgende CMD Steuerkom- 
inandos implementiert werden: 

load_const: Lade eine Konstante in ein Register 

write_Rap: Setze Adress Pointer £ttr Speicherzugrif f e 

fz. B. Heap) 

read_Rap: i,ese Adress Painter Mr Speicnerzugrifte 

(s. B. Heap) 

Lese ein Register aus dero Speicher (wenn Register in 
der RAM-fae intplementiert sind) 
write^Reg: Sohreibe Daten in ein Register im Speicher (wean Regi- 

ster in der RAM-P&E impXementiert sind) 
writesdecrjlap: Schreibe ein Datenwort auf den staek und dekrementiert 

den Stackpointer 

readsincr_Rsp: L( »se ein Daeenwort vom stack vnd inkrementeiere den 

stackpointer 
set_Rpp: Setze Programmpointer 

set&push_Rpp : Schreibe Prograrompoineer auf stack und setze Program- 

pointer neu 



Die Steuerkommandos dienan der Steuerung der angeschlossenen Speicher- 
zellen und Funktionszellen (PAE5 , . Weitexhill steue:na die steuerkoinmanaos 
den Datentransfer auf den Bus SysCemen , beispielsweise durch 
von Multiplexer*, Switches, Transmission Gates, o. a. in den Forward- 
25 und Backward- Regis tem (FREG/Breg) . W *i tere Befehle sind z. B. : 

read_Port: Lese Datea von 6inem porfc (beispielsweise impleraeil _ 

tiert durch ein FREG) zum Array 
write_Port.- Schreibe Daten auf einen Port (beispielsweise imple- 

raentiert durch ein BREG) zum Array 

30 

Dies kann durch eine entsprechende Bicbreite der Steuerleitung und eine 
zugeprdn e ce Decodierung bei den Empfengem erfolgen. Die jeweils erfor- 
derlichen Steuer- und Dekodiermittel konnen problemfrei und koetengun- 
stig vorgesehen werden. w ie ersichtlich. ergib* sich mit den Signalen 
35 exne prak t i sc h vall st5ndi3e Seguenzerfabxgkeit aer Anordnung. D aS auf 

diese weise eine Allgemeinzweckprozessordatenverarbeitungseinheit erhal- 
ten wird, sei erwahnt. 
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Die Anordmmg wird typisch so gewahlt sein, daS die Funktionszelle als 
alleiniger Master auf die Steuerverbindung und/oder ein als Steuerver- 
bindung dienendes Bussegment bzw. Bussystem zugreifen kann. Es ergibt 
sich somit eine Anordnung, bei der die Steuerleitung als command- Leitung 
wirkt, wie sie in herkommlichen Prozessoren vorgesehen ist. 

Die Funktionszelle und die Speieherzelle bzw. l/o-Zelle sind bevorzugt 
benachbart angeordnet. Tftiter benachbart kann dabei wie bevorzugt ver- 
standen werden. da£ die Zellen unmittelbar nebeneinander angeordnet 
sind. Alternativ befinden sie sich zumindest dicht beieinander. Die An- 
ordnung der Funktions- und Speicherzellen in Nachbarschaf t zueinander 
sorgt dafur, dafi keine, jedenfalls keine signif ikancen Latenzzeiten zwi- 
scfaen Ansteuerung und Dateneingang der angeforderten Information in der 
Funktionszelle auftreten. nur weil die verbindungen zwischen den Zellen 
zu lang Bind. Dies sei als „direkt« verstanden. Mussen Latenszeiten be- 
rttcksichtigt werden, so kann auch ein Pipelining in den Sequenzerstruk- 
turen vorgesehen warden. Dies wird besonders wichtig bei sehr hoah ge- 
takteten Anordnungen. Es sei darauf hingewiesen, dafi es ohne weiteres 
mSglich ist, encsprechend hochfrequent getaktete Zelleinheitea vorzuse- 
hen r die wie im Stand der Technik per se bekannt, auch entsprechend 
schnell auf geeignete Speicherzellen zugreifen k6nnen. Auch in einem 
solchen Pall, etwa wenn per se bekannte Architekturelemente fur die 
Funktionszellen verwendet werden. wird gleichzsicig eine Rekonf igurier- 
barkeit des Funktionszellenelementes und der zugehdrigen Vemetzungen 
vorzusehen sein. In einer besonders bevorzugten Variants sind die Funk- 
tionszellen, die Informationsbereitstellungszellen wie Speicherzellen, 
I/O-Zellen und dergleichen multidimensional angeordnec, insbesondere 
naah Are einer Matrix bzw. auf Gitcerpunkten eines eindimensionalen Bit- 
ters usw. wenn eine regelmaSige Struktur vorliege, wie dies dort der 
Fall ist, wird einer Zelle typisch aus einer ersten Reihe Information, 
das heiSt Operanden, Konf igurationen, Triggersignale usw. zugefuhrt, 
wahrend in einer darunterliegende Reihe Daten, Triggersignale und andere 
informationen abgegeben werden. In einem solchen Fall wird es bevgrzuge 
sein, wenn die Zellen in ein und derselben Reihe liegen und es kann dann 
der informationstransfer aus der Informationsbereitstellungszelle in den 
erforderlichen Eingang der Funktionszelle uber ein Backward-Register er- 
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folgen. Pie Moglichkeit, die Register fur Pipelining zu benutzen, sei 
erwalmt. 

ES wird weiter Schutz beansprucht fur ein Verf ahren zum Betrieb eines 
Zellelementefeldes, insbesondere multidimensionalen Zellelementef eldes 
mifc Funktionszellen zur Ausfuhrung algebraischer und/oder logisoher 
Funktionen und Informationsbereitstellungszellen, insbesondere Speicher- 
zellen und/oder Ein-Ausgabezellen rum Empf angen und/oder Ausgeben von 
Informations und/oder Speichera derselben, wobei zumindest eine der 
Funktionszellen Steuerbef ehle an zumindest eine Inf ormationsbereitstel- 
lungszelle ausgibt, dort itn Ansprechen auf die Steuerbef ehle Information 

die Funktionszelle bereitgestellt wird und die Funktionszelle dazu 
ausgebildet ist, die weitere Datenverarbeitung im Ansprechen auf die be- 
reitgestellte Information durchzufuhren, urn so sequenzerartig Daten zu 
15 verarbeiten, 

Es wird also in einem rekonf igurierbaren Feld durch. die Ausgabe der 
Steuerbefehle an die Speicharzelle einer Sequenzerstruktur eine sequen- 
zerartige Datenverarbeitung ermoglicht. Die Befekle, die als Steuerbe- 
fehle von der Punktionszelle ausgegeben werden konnen, ermoglichen dabei 
einen sequenzerartigen Betrieb, wie er aus Herkommliohen Prozessoren be- 
kannt ist. Bs sei darauf hingewiesen, da£ es ohne weiteres moglich ist, 
nur Teile der genannten Befehle zu implementieren und dennooh eine voll- 
standig sequenzerartige Datenverarbeitung zu gewahrleisten. 
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Die vorstehende Ausf uhrungsvariante wird im folgenden noch einmal und 
beispialsweise anhand der Zeichnungen beschrieben. In dieeer ist gezeigt 



durch: 



30 Fig. l ein erf indungsgemaSee Zellelementef eld, 

Fig. 2a ein Detail hiervon, 

Pig. 2b, c das Detail von Pig, 2a wahrend verBChiedener 

Datenverarbeitungszeiten, 
Fig. 3a eine alternative Ausfuhrungsform des Details 

von Fig, 2, 

Fig. 3b . eine besonders bevorzugte variante des 

Details. 
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Fig. 4 Grundaufbau einer Funktions-/Speicherzelle 

(PAE) 

eine Ausgestaltungsvariante von Fig. 3b 



Fig. 5 



Nach Fig. i(a/b> umfaSt ein allgemein mit 0101 bezeicbnetes ' Zellelemen- 
tefeld sur Datenverarbeitung 0101 Funktionszellen 0102 zur Ausffihrung 
von arithmetiscfaen und/oder logischen Funktionen sowie Speicherzellen 
0103, urn Informations zu empfiangen, abzuspeichern und/oder auszugeben, 
wobei eine steuerverbindung 0104 -on Funktionszellen 0102 zu den Spei-' 
cherzellen 0103 gef fibre isc. 



Zunachsc wird die Arbeitsweise v on Fig. la beschrieben. Fig. lb stellt 
eine bevorzugce Ausgestaltung und Anordung der Funktionszellen und Spei- 
15 cherzellen dar. 

Pas Zellelementefeld 0101 ist in der Vernetzung der Elemente 0102, 0103, 
0104 frei konfigurierbar, vnd zwar ohne den laufendan Becrieb nicht neu 
zu konfigurierender Zellelementeeeile zu storen. Dabei konuen die Ver- 
bindungen kenfiguriere werden, indem Bussysteme 0105 w ie erforderlich 
geschaltet werden. Weiter sind die Funktionszellen 0102 in ihrer jewei- 
ligen Funktion konf igurierbar . Bei den Funktionszellen handelt es sich 
um arittunetische Logikeiuheiten. die um bestimmte, Rekonf iguration er- 
moglichende Schaltkreise erweitert sind, wie Statemachines , Schnittstel- 
lenbeschaltung sur Kommunikation mit der bevorzugt auSsrhalb des Zelle- 
lementefeldes angeordneten Ladelogik 0106 u^w. Au f die entsprechenden 
voranmeldungen des Anmelders wird hingewiesen. 

Die Zellelemente 0102, 0103 des Zellelementef aides l sind zweidimensio- 
nal in Reihen und Spalten angeordnet, wobei jeweils eine Speicherzelle 
0103 unmi« e ibar neben einer Funktionszelle 0102 liegt und bier je Reihe 
drei Speicherzellen-Funktionszellen-Paare vorliegen, in denen die Funk- 
tions- und speicberzellen jeweils fiber Steuerverbindungen 0104 miteinan- 
der .erbunden sind. Pie Functions- und Speicberzellen 0102, 0103 weisen 
Eingange auf, die mic dem Bussystem oberbalb der Reihe, in der sich die 
jeweilisren Zellelemente verbindbar sind, urn Oaten davon zu exnpfangen 
Weiter weisen die Zellen 0102, 0103 Ausgange auf, die auf das Bus SysCea , 
o« S unterhalb der Reihe Dateu ausgeben. wie noch erlaucert werden wird 
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ist uberdies jede Speicherzelle 0103 mit einera Ruckwartsregister (BW) 
versehen, durch welches Daten van dera Bus unterhalb einer Reihe auf den 
Bus oberhalb der jeweiligen Reihe durchgeschleust werden konnen. 

Mit Ausnahme der Steuerverbindungen 0104 und der zugeordneten Schaltun- 
gen innerhalb der Funktionszellen (ALU in Fig. 2) bzw. Speicherzellen 
(RAM in Pig. 2 ) handelt es sich bei dem Zellelementefeld zur Patanverar- 
beitung von Fig. i um ein herkSmmliches Zellelementefeld. wie es bei re- 
konfigurierbaren Datenverarbeitunsanordnungen, beispielsweise einer vpu 
entsprechend der XPP-xechnologie des Anmelders gebrauchlicn und bekannt 
f ist. Insbesondere kann das 2ellelementefeld von f± 3 . i wie bekannt be- 

trieben werden. weist also entsprechende Beschaltungen zur Wave- 
Rekonfiguration, zum Debugging, Obertragen von Triggeraignalen etc. auf. 
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Die Besonderheiten des zelXeXemencefeldes der vorliegenden Erfindung er- 
geben sich aus der Steuerverbindung oio 4 und der zugehorigen Beschal- 
tung, die nachfolgend naher beschrieben werden wird rait Bezug auf die 
Fig. 2a-c. es sei dabei erwabnt, daS, waHrand in Fig. i eine steuerver- 
bindung 0104 stets von einem weiter links liegende Funktionszellenele- 
ment zu einer weiter rechts liegenden Speicherzelle gefuhrt ist, und 
zwar nur und genau zu einer solchen Speicherzelle, es einleuchtenderwei- 
se moglich isc . auoh fur ^ Steuerleitmxgen eine ko n f igur . ierbare Ver _ 
netzung vorzusehen, urn entweder an anderer Stella liegende Speicherzel- 
len anzusprachen und/oder um ggr. raehr als eine Speicherzelle ansprechen 
zu konnen, wenn etva in groSem Urafange Speicherbedarf fur Informationen 
besteht, die von den speicherzellen zu empfangen, abzuspeichern und/oder 
auszugeben ist. Aus GrQnden der Sbersichtlichkeit wird aber in Fig. i 
und 2 lediglich auf fest vorgesehene einzelne Steuerverbindungen Bezug 
genommen, was das Verstandnis der Erfindung wesentlich erleichtert. Die 
Steuerverbindung ist im ubrigen erf orderlichenfalls durch herkommlicha 
Leitungen, entsprechende Protokolle vorausgesetzt, substituierbar . 

In Fig. 2 ist die Funktionszelle 0X02 als ALU und die Funktionszelle 
0103 als RAM bezeichnet. Oberhalb der Reihe, in der die Zellen liegen, 
verlauft aer Bus 0 105a , dejr to bereies erw4hate Backward-Register oio 3a 
mit den Eingangen 0X03b der Speicherzelle und 0102b der ALU verbindet. 
Das unterhalb der Reihe verlaufende Bussyscem ist mit 0105b bezeichnet 
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und es sind dem Bussystem 0105a, oiosb nur die relevanten Segments 
geaeichnet. Es ist erkennbar , daJB das Bussystem 0l05b alternativ Daten 
erhalt aus einam Ausgang 0102c der ALU 0102, einem Ausgang 0103c des RAM 
0103 und daS es Daten in den Eingang 01Q3al des Backward-Registers 
5 fiunrt. 

Die ALU 0102 weist zugleich weitere Ein- und Ausgange 0102al. 0102a2 
auf, die auf andere Bussegmente gesehaltet sein konnen und fiber welche 
die ALU Daten wie Operanden empfangt bzw. Ergebnisse ausgibt. 
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Die steuerverbindung 0104 bef indet sich dauerhaft unter der Kontxolle 
der erweiterten Scnalckreise der ALU und stellt bier eine Verbindung 
dar, uber welche eine Vielzanl v on Bits ubertragen werden kann. Die 
Breite der Steuerverbindung 0104 ist dabei so gewahlt, dafi zumindest die 
zuvor besehxeibenen Steuerbef ehle an die Speicherzelle und die For- 
ward/Backward-Register (FRES/BREQ) ubertxagen werden kdnnen. Die Spei- 
cherzelle 0103 weist zugleich bevorzugt drei speicherbereiche auf, nam- 
licb einen sog. Stack-Bexeich, einen Heap-Bereich und ein en Programm- 
Bereich. Jedem Bereich ist dabei ein eigener Zeiger zugeordnet, uber dan 
bestiromt ist, auf welchen Bereich des Stacks, des Heaps und des Pxo- 
sxamnibereicb.es jeweils lesend oder schxeibend zugegxiffen wixd. 



Der Bus 0105a wird im zeitmultiplex gemeinsam von den Einheiten 0102 und 
0103 verwandet. Dies ist in den Fig. 2b, 2c angedeutet. so ist in Fig. 
2b sine Situation gezeigt, in welchex aus dem Ausgang 0102a2 der ALU-PAE 
Daten uber das Backward-Register auf den Eingang der RAM-Zelle gesandt 
werden kSnnen, wohingegen der zeitgleich bestehenden, wenngleich nicht 
benutzten Verbindung zwischen dem Ausgang 0103c des RAM zum Bus 0105b 
und der Verbindung zwischen dem Ausgang des Backward-Registers BW zum 
30 Eingang 0102b der ALU-PAE zum Zeitpunkt von Fig. 2b keine Bedeutung zu- 
kommt, weshalb diese gestrichelt angedeutet sind. In Fig. 2c ist hinge- 
gen ein Zeitpunkt gezeigt, zu welchem die Speicherzelle 0103 Obex ihxen 
Ausgang 0103c aus dem uber steuerleitung 0104 bestimmten Speicherbereich 
Stack (0203), Heap (0202), Program (0201) die Information uber das Back- 
ward- Register an den Eingang 2b dex ALU-PAE 0102 speist, wahxend dex 
Ausgang der ALU-PAE 0102c inaktiv ist und am Eingang 0103b der RAM-EAE 
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Jcein Signal empfangen wird. Aus diesem Grund sind die entsprechenden 
verbindungen striehpunktiert und sorait als inaktiv dargestellt. 

Innerhalb der RAM-Zelle 0X03 ist eine Schaltung 0103d vorgesehen, in der 
die uber die Steuerleitung 0104 bzw, oas Steuerleitungsbussegment 0104 
empfangene Information decodiert wird. 

Pie Ausfuhrungsvariante der Erfindung wird verwendet wie folgt: 

Zunachst empfangt die alu 0102 Konfigur anions information von einer zen- 
tralen Ladelogik, wie ± m stand der Technik bereits bekannt. Die Informa- 
tionsubertragung kann in per se bekannter Welse unter Verwendung des 
RDY/ACK-Protokolls und dergleichen geschehen. Auf die Moglichkeit, bei 
der Ladelogik einen FILMO-Speicher usw. vorzusehen, urn eine ordnungsge- 
ma£e Konf iguration der Anordnung zu ermoglichen, wird hingewiesen. 

Mit den Daten fur die Konf iguration der ALU 0X02 wird zugleich eine Rei- 
he paten aus der Ladelogik Gbertragen, die ein seguenzerartig abzu- 

arbeitendes Program dsrstellfc. Dieses Programm kann entweder bereits 
das zur Berechnung bzw. AusfQhrung der Applikation auszufuhrende Pro- 
gramm sein, oder einen Urlader (Boot) darsfcellen, der erst das auszu- 
fuhrende Applikationsprogramm von einer extemen Einheit (Speicher. Pe- 
ripherie) ladt. Das Laden des Programmes kann entfallen, wenn ein Teil 
des der ALU zugeordneten Speiohers nichtf luchtig (z . B. ROM, eprom, ee- 
PROM, Flash-ROM) ausgestaltet ist und ein TJrlader oder das Applikations- 
programm dort fest gespeichert ist. Dies kann insbesondere dann von Vor- 
teil sein, wenn die Applikation vorab bekannt ist und unabanderlich ge- 
staltet werden kann, da eine feste Implementierung dann Z u einer erheb- 
lichen Kostenreduktion fuhren kann. Die ALU gibt deshalb wahrend ihrer 
Konf iguration auf der Leitung 0104 einen entsprechenden Befehl aus, der 
den Programmzeiger zum Sohxeiben auf einen vorgegebenen Wert innerhalb 
des RAM setzt. Danach werden von der Ladelogik bei der ALU empfangene 
Daten uber den Aus gang 0102c uber den Bus OXOSbl und das Backward- 
Register 0i03a gespeist und gelangen von dort in den Eingang 0103b der 
kam-pab 0103. v«p n der Binheie 0103d werden entsprecbend des Steuerbe- 
fehls auf steuerleitung 0104 dann Daten auf den angewiesenen Prog ra mm- 
speicherplatz geschrieben. Dies wiederholt sich, bis samtliche, von der 
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Ladelogik bei der Konf iguration empfangenen Progranunteile in der Spei- 
cherzelle 0103 abgelegt sin d. Wenn daun die Konf iguration der ALU been- 
det ist. wird diese durch Ausgabe der eutsprechenden Befeble auf der 
Steuerleitung 0104 die nachsten, von ihr seguenzerartig abzuarbeitenden 
Progrannnschritte anfordem und uber den Ausgang OlOSc, den Bus Qiosb, 
das Backward-Register der RAM-PAE 0103 und den Bus OlOSa an ibrem Bin- 
gang empfangen. Wahrend der Programmabarbeitung konnen dabei Situacionen 
auftreten, bei denen Sprunge innerhalb des Prograrcmspeicnerbereicfaes er- 
fiorderlicb sind, Oaten in die ALU-PAE aus der RAM-PAE geladen werden. 
Paten im Stack abgelegt werden mussen usw. Die diesbezuglicne Koinmnnika- 
tion zwischen alu-PAE und RAM- PAS erfolgt uber die Steuerleitung 0104, 
so daS die alu-pae zu jedera Zeitpunkc die Dekodierung durchfubren kann. 
Oberdies konnen aucb, wie bei einem herkommlicheu Mikroprozessor, oaten 
aus einem stack oder einem anderen RAM-Speicberbereich empfangen werden 
und es konnen uberdies Daten von auSerhalb als Operands in der ALU-PAE 
^mpfan^en werden. 

Bs findet dabei die Abarbeitung der Progratnmsequenz statt, die in den 
BAM-FAB durch die Ladelogik vorkonfiiguriert wurde. In der ALU-PAE wird 
dabei zugleich., wie per se erforderlich. eine Befehlsdekodierung vorge- 
uommen. Dies gescbiebt mit den per se gleichen Schaltkreisen, die schon 
fur die Dekodierung der von der Ladelogik ernaltenen Befeble verwendet 
werden. 

Es wird uber die ALU su ^edeu, Zeitpunkt die Steuerleitung 0104 kontrol- 
lierr, so dafi die RAM-Zelle stets genau die Art des Speicher 2 ugrif f es 
befolgt, die von der ALU vorgegeben ist. Auf uiese Weise ist sioherge- 
stellt, daS ungeachtet der Zeitmultiplex-Benutzung der Buselemente 
Oiosa, b jederzein den in der Sequenzerstruktur vorhandenen Elementen 
V ° rSa9eben ist ' ob mussen AOressen fur zu holende und/oder zu 

schreibende Uaten Oder Codes liegen oder ob und gegebenenfalls wobin Da- 
ten zu scbreiben sind etc. 

Die in Bezug auf Pig. 2 geseigte Anordnung kann auf unterschiedliche Ar- 
ten erweitert oder vender* werden. Besonders relevant sind die in Fig. 
3a una 3b dargestellten varianten. 
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Nach Fig. 3a ist zur Verbindung voa oberen und unteren Bussen nicht nur 
ein Backward-Register an der RAM- PAS vorgesehen, sondern es sind audi 
ein Vorwarts -Register an der RAM-PAE und Vorwarts- und Ruckwarte- 
Register an der ALU-PAE vorhanden - Diese konneu, wie durch die Mehrfach- 
5 Pfeile angedeutet, dazu dienen, von anderen Einheiten, wie externen 
Hosts, extcrnen Peripherie-Geraten wie Festplatten, Hauptspeicher und 
dergleichen und/oder von anderen Sequenzerstrukturen, PAEs, RAM- PAEs 
etc. paten zu erapf angen und an diese zu senden. Wenn ein entsprechender 
Anf orderungebef ehl fur neue Progratmnteile aus der Sequenzersfcruktur, die 
10 durch die ALU- PAR und die RAM- PAS gebildet ist, abgesandt wird, ist es 
mSglich, Programmblocka in der Seguenzerstruktur abzuarbeiten, die weit 
grdfier sind als jene, die in der RAM-PAE speicherbar sind- Dies ist ins- 
besondere bei komplexen Datenverarbeitungsauf gaben, Sprungen uber weite 
Bereiche, insbesondere in Uhterprogramrae usw. von massivem Vorteil. 

15 

Bine noch weiter bevorzugte Variante ist in Pig. 3b gezeigt. Hier kotnmu- 
niziert die ALTT-PAE nicht nur mit einer RAM-PAE, sondera zugleich mit 
einer Input / Output - PAB , die dazu ausgebildet ist, eine Schnittstellenbe- 
schaltung fur die Komtnunikation mit externen Bauelementen varzusehen, 

20 wie Festplatten, anderen XPP-VPTJs, fremden Prozessoren und Coprozessoren 
usw. wiederum ist die ALU-FAE die Einheit, die als Master fur die als 
„CMD* bezeichnete Steuerverbindung arbeitet und wiederum werden die Bus- 
se in Multxplex-Weise verwendet, Auch hier kann eine ©bertragung von Da- 
ten von dem Bus unterhalb der Reihe in den Bus oberhalb der Reihe durcn 

25 das Backward- Register erfolgen. 

Pie in Fig. 3b gezeigte Anordnung erro6glicht es, externe Zugriffe auf 
nicht in der Speicherzelle RAM-PAE abspeicherbare Infortnationen beson- 
ders leicht zu gestalten und erm6glicht damit eine Anpassung der Sequen- 
zerstruktur an bestehende, herk6mmliche CPU-Technologien und deren Be-* 
triebsverfahren in noch starkerem MaSe insoweit, als nun in der Bingabe- 
Ausgabeselle Adressubersetzungsmittel , Speicherverwaltungseinheicen 
(MMU-Funktionen) und dergleichen iznplementiert sein k&nnen. Pie RAM-PAE 
kann hier etwa als Cache, insbesondere aber als vorgeladener Cache die- 
35 neu. 
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Bs sei darauf ixingewiesen, da& mehrere Sequenserstrukturen gleichzeitig 
in ein und dasselbe Feld hineinkonf iguriert werden konnen, dafi Funkti- 
onszellen, Speicherzellen und ggf , Eiu-Ansgabezellen wahlweise fur 5e- 
quenzerstrukturen und/oder sine fur die XFF -Techno la gie herkommlicne 
Weise konf igurierc werden konnen und dafi es a hue weiteres moglich ist, 
daS eine ALU an eine andere ALU Daten ausgibt, die die9e in einer Se- 
guenzer^weise konfigurieren und/oder zum Teil eines Eellelmentef eldes 
machen, mit dem eine bestimmte Konfiguratiou abgearbeitet wird. Auf die- 
se Weise wird dann gegebenenf alls auch die Ladelogik entbehrlich. 



Figur 4 zeigt nun noch einmal detailliert den Grundaufbau einer PAE- Der 
Kern einer FAE, typischerweise bestehend aus einer oder mehreren ALUs 
und/oder einem Speicner und/ oder FFGA- Element: en erha.lt Daten von dem 
Bussystem 0105a und Obertragt die Brgebnisse der Datenverarbeitung an 
das Bussystem 0105b. Neben dem Kern sind die Forward-Register (FREG, 
0402) und Backward-Register (BREG, 0403) angeordnet und ubertragen Paten 
von 0105a naen 0105b (FREG) bzv, von 0105b nacli 0105a (BREG) .BREG und 
FREG konnen ebenf alls eine oder mehrere ALUs und/oder einem Speicher 
und/oder FPGA-Slementen enthalten. Bevorzugt sind diese jedooh in ihrem 
Funktionsumfang gegenuber dem Kern (0401) eingeschrankt . 
Die Bussysteme 0105a und OlOSb sind bevorzugt jeweils in ein Bussystem 
zur tibertragung von Daten (DATA) und ein Bussystem zur Ubertragung von 
Trigger, also Status signal en (TRIGGER) unterteilt. 

Die Konfigixration der 3?AB erfolgt ciurch eine ubergeordnete Konf igurati- 
25 onseinheit (z. B. eine CT) , die uber einen Konf igurationsbus (0404) Kon- 
figurationsworte an die FAE ubertragt. Diese werden in Konf igurationsre- 
gistem gespeichert (04D5) . Optional kann ein Konf igurationss tack (0406) 
nach PACT17 und wie imchfolgend beschrieben zwischen den Konf igurations- 
bus (0404) und die Konf igurat ions register (0405) zwischengeschaltet 
30 ©ein. 

Der Konf igurationsstack kann Daten und/oder bevorzugt Trigger von den 
Bussystemen O10S (a/b) empfangen und an diese senden. 

Die PAE kann optional einen AnschluS an ein dediziertes Bussystem (IO- 
35 Channel, 04 0 7) aufweisen. Zur Steuerung des Bussystems 1st dem Kern 

(0401) eine zusatzlioae Bussteuereinheit (0408) zugeschaltet . frber den 
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IO-Ciiannel kan die PAE direkt mit einem globalen, ggf . aucfa externen 
Speicher und/oder Peripherie und/oder anderen PAEs Paten ubertragen . 

In einer bevorzugten Ausge stalcung besteht die Moglichkeit Konstanten 
5 fur die Datenverarbeitung ttber 0404 zru setzen. In einer Weiteren Ausge- 
staltung kann eine Konf iguxationseinheit [z. B. CT) Da ten aus don Ar- 
beitsregistern auslesen. 

Figur 4 kann auch eine entsprechende RAM- PAS darstellen. ifcer 0404 kann 
!0 dann vcn einer CT die Vemetzung und Funk t ion des RAMs eingestellt wer- 
den. 

Die Funktion umfafit beispielswiese folgende Funktionen oder Kotnbinatio- 
nen da rati s : 

15 l. Random Access 

2. FIFO 

3 . Stack 

4 . Cache 

5. Page Memory fur MMUs 

20 

Desweiteren kann in einer bevorzugten Ausfuhrung der Speicher tnit Daten 
von der CT verge laden we r den (s . B. Konstaatett, 

Lookup -Tabellen, etc.) - Ebenfalls kann die CT in einer erweiterten Aus- 
fuhrung Daten (2. B. zum Debuggen oder fur Taskwechsel) aus dem Speicher 

25 uber 0404 zurucklesen. 

In einer bevorzugten Ausfuhrung kann eine RAM-fae mehrere Anschlusse an 
das Bussystem 010S aufweisen (dual -port oder multi-port) , wodurch mehre- 
re Datentransfers gleichzeitig durchgefuhrt werden konnen. 
In einer weiteren Ausfuhrung kann die RAM-PAE einen dedizierten AnschluJS 

30 an einen externen Bus aufweisen. 

RAM- PAEs kannen der art zusarmnengeschaltet werdexi, dass aus mehreren (n) 
RAM- PAE s ein n-fach grofierer Speicher entsteht. 



Figur 5 zeigc eine Ausgestaltungsvariante dies seguenzers nach Figur 3b. 
Pie ALU- PAE weist einen minimalen Registersatz Ra, Rb, Rx auf , der in 
diesem Beispiel lediglich zur Pufferung der Operanden und Brgebnisse 

25 
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dient. Der eigentlicne Registersatz liegt in der RAM-PAE (RO..Rn). Eben- 
falls innerhalb der RAM-PAE liegen die Register 
Rpp: Programm Pointer- 

Rap: Adress Pointer fur Datenzugrif fe (z.B. Heap) 

5 Rsp: Stack pointer fur Stackzugrif f e 

Rfpr Frame Pointer zur Sicherung des Stack Pointers 

bei Unterprogrammaufruf en 
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Der CMD-Bus wird von der ALT7-PAE gesteuert und ubertragt die Ablauf in- 
formation des Sequencers an satntliche beteiligten PAEs, eowie FREG und 
BRB<3 zur Steuerung der Datenubertragung auf den Bussysteroen (OlOSa, 
0XD5b) . 

Die RftM-PAE weist in diesem Ausgestaltungsbeispiel einen dedizierten lo- 
Cannel (0501) auf, fiber welctoeu sie ggf. auch selbststandig {z. B. uber 
DMA-Kontroller) Daten von oder zu peripheren Einneiten (z.B. IO, Spei- 
cher) ubertragen kann. Es soil nochntals darauf hingewiesen werden, dass 
auah die ALXT-PAEs einen solchen dedizierten AnscnluS aufweisen konnen 
Oder in einer weiteren Ausgestaltungsvariante die ALtX-PAE anstatt der 
RAM-FAE einen derartigen AnschluB besitzen konnte. 

Optional sind eine Oder mehrere Datenaustauscbvorrichtungen mit den 
restlichen Zellen des FAs (z. B. Funktions- und/oder Speicherzellen) ini- 
plementierfc. 6ber Eingabe- Ports (0502) konnen Daten von dem PA gelesen 
werden und uber Ausgabe-Ports (0503) konnen die Daten ausgetauseht wer~ 
den. Die Port werden beispielsweise uber die CMD-Steuerkoimnandos 
readjport und writ export angesteuert und ©chalten die Bussysteme ent- 
sprechend. Mit den steuerkommandos wird ein Selektor ubertragen, der an- 
zeigt welcber Port durcti das Steuerkommando angesprocben ist. 
Die vorliegend offenbarte I*age der Register innerhalb der RAM-PAE ist 
ungewohnliali, bietet aber zwei erhebliche vorteile: 

a) Speioherzellen konnen fur die Register verwendet werden * 

b) Die Pointer liegen direkt in tier BAM-PAE, wodurch Datenzugrif f e auf 
den Speicher besonders schnell werden- Desweiteren ist fur samtliche 
Speicher- Zugriffe nur ein Bus auf de m Bussystem 0105 notwendig, wobei 
der normalerweise zusatzlich erf order liche Adressbus entfallt, da die 
Adressen lokal in der RAM-PAE durch die Pointer gegeben sind. 

Diese Anordnung wird daher als vom Anmelder bevorzugt typisch implement 
tiert . 
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i9t «« Register Z u beachten. Um 

lediglieh m a 3li ch St einfache Befehle im Sequenzer zu iinplemeiltlereil> 
sind daher bes = ndSre Befehle zur Registermanipulation TOrgssehen: 
5 moveta Rrr = Ladt das Re 3 i 6Cer Rrr (rr , ^ ^ ^ p ^ 

fp, ap}) nach Ra 
movetb Rrr, Ladt das ReHiBter Rrr na=h ^ 

movefx Rrr: schreibt da S Register Rx nach Rrr 

10 um den Datenf luficharacter der ALU zu wahren **, 

. . u ^ nren ' 1st bevarzugt ein weiterer 

basonderer Opcode implementiert : 

f«d: fibertragt Daten von Ra/Rb nach Rx, ohne diese 

zu taanipulieren. 

15 *^ZT7*1 BeieP±ele ^ Utl±chen ^ —is. des s™, 

-dxere .agister Rl zu ^ „ una schreibQ ^ 
nwveta Rz,- movetb R 2 ; add; movefx R 2; 

20 Schiebe Register R4 nach Register R7 : 
moveta R4,- feed; movefx R7; 

Ubertrag-e Rs auf Stack: 

moveta R5; feed,- push; 

25 Anmerkuixg: push ubertragt Da ten des RecTi „. 0T . 0 „ 

auf di e p« S Re S lste «< Rx an die Speicherstelle 

auf dxe Rsp zeigt uud dekrementiert (bzw. inkezmentiert, Rsp . 

Setze Adresspointer Rap .it der indirekten ACresse r 4 addiart Z u R7- 
moveta R4; movetb R7; add; movefx Ra; 

30 

Lade Daten aus Speicherstelle Rap nach Re- 
load; feed; movefx Rl; 

35 

Die Datenregister werden bevarzugt innerh a i>, ^ 

ancpnr , „ gC innerhalb des Speichers der RAM-RAE 

angeordnet, z. b. von Adresse 0x0 bis o X 7 (£flr „ „ , 

0x7 (fur n = 7>. Register we r den 

27 
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beiepielsweise angesprochen, indent beim Auftreten des entsprechexiden CMD 
Steuerkommandos (z. B. read_reg, write_reg) die Regis ternuramer mituber- 
tragen wird, diese als Adresse an den Speicher ubertragen wird und die 
hoherwertigen Adressbits mit 0 gefullt werden. 

Die Startadresse fur den Code ware dann beispielsweise 0*8 (also 
0x(n+l)), worauf dann der Frogrammpo inter Rpp nach einera Reset zeigen 
wurde . 

Die Adresszeiger werden bevorzugt nicht im Speicher abgelegt, sondem in 
gesondert: iraplementierten Registern untergebracht , um eine schnelle und 
einfache Aufschaltung auf die Adressleitungen des Speichers zu ermogli- 
chen. 

In Figur 5b ist eine Architekturvariaute tnic Regis t ersatz innerhalb der 
ALtr-PAE dargestellt. Die umstandlichen Register trans f eroperationen enc- 
f alien damit, wodurch diese Variante auch erheblich schneller in der Da- 
renverarbeitung ist. Allerdings ist sind die Hardwarekasten holier, da 
der Registersatz zus&tzlich implementiert werden muss und fur samtliche 
Speicherzugriff e die Adressen von der ALTT-PAK an die RAM-PAE ubertragen 
werden raussen. 



RAMoverPAS 

Die nachfolgend beschrieoene beeondere Ausgestaltung einer AliU-PAE (im 
Folgenden mit ROP-PAE bezeichnee) eignet sich besonders fur VPUs, deren 
Applikation irxegulaxe sequentielle Codes aufweisen, die auf kleine Da- 
25 tenntengen in einer veitrgehend ungeordneten Reihenfolge zugreifen. 

Zur Rsalisierung dieser Aufgabe wird in eine ALTJ-PAE Speicher integriert 
(Integrated RAM = XRAM) , auf den die ALU direkten Schreib/l^ese-Zugrif f 
besitzt. Die ai/cj ist entsprechend um eine Adressverwaltungsschaltung er- 
weitert. Insbeeondere konnen daher PABs nach dem vorstehend beschriebe- 
nen Aufbau (IPAEs) verwendet werden, wobei der separate RRAM ggf . ent- 
f£llt und durch den integrierten I RAM ersetzt ist oder der RRAM zusacz- 
lich zum intemen I ram quasi als Speichererweiterung vorgesehen ist. 

35 In einer besonders bevorzugten Aiaefuhxung i B c ein Sequen2er bzw. Micro- 
controller mit einem bevorzugt limifcierfcen aber bevorzugt vollsnandigen 
Befehlssatz (vgl. ARC Microprocessor) in der ROP-PAE integriert, oler die 

28 
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vsrarbeitung- seguentieller codes ermoglicht. In einer weiteren Ausfuh- 
rungsvariante kann der Sequencer in seiner Fuxiktion und seineni Ablauf- 
verhalten auch konf igurierbar ausgestaltet sein (wie beispielsweise nach 
dem Stand der Technik bekannt, z.B. durch EPS448 von Altera [ALTERA Data 
5 Book 1593]). Der Sequenzer /Microcontroller kann au£ Zustande (z.S. sta- 
tussignale, Ereignisse) in der ROP-PAE und/oder auf Zustande (z. B. auch 
Trigger) anderer PAEs die mit der ROP-PAE verbunden sind <z,B. uber ein 
Bussystem) reagieren , 

Der Sequenzer/Microcontroller liesc seine Programmbef ehle aus dem ISAM. 
10 Die Zugriffe auf das Bussystem des Arrays (PA) entsprechen den ubliclien 
PAEs f ebenso die Generierung, der Eropfang und die Weiterleitung von Sta- 
tussignalen (Trigger nach PACT08) . Mehrere Busanbindungen fur Da ten- und 
Triggereingange und fur Daren- und Triggerausgange konnen vorgesehen 
sein. 

15 Die ROP-PAE kann Operanden vom BU3 lesen ggf . raehrzyklisch Verarbeiten 
und das Ergebnis wieder auf den Bus schreiben. 

In die ROP-eae ist in einer bevorzugten Ausgestaltung ein Registersatz 
integriert. Der Registersatz kann in einer besonderen Ausgestaltung ahn- 
lich des Regis tersatzes von Transputern ale stack organisiert, Dadurch 

20 kann der Registersatz besonders klein und hardwaretechnisch eff izient 
realisiert warden (typischerweise reichen 3 Register A, B und C aus) . 
Weiterhiu ist aus der Transputertechnologie bekannt, dass Compiler ef fi- 
zient mit eineni derartigen hardwaretechnisch kostengunstigen Register- 
satz arbeiten konnen. Bbenfalls kann der Registersatz optional im RRAM 

25 liegen. 

In einer bevorzugten Ausfuhrung besitzt die ROP-PAE direkten AnschluS 
(BXTBUS) an ein exterues RAM und/ Oder externa 10. Es konnen applikati- 
onsabhangig mehrere EXTBUS vorgesehen sein. In einer dabei besonders be- 
30 vorzugten Ausgestaltung kann der EXTBUS uber eine f ggf. dedizierte, Ver- 
bindung des PAE-Bussystetns an eine Interf ace-Baugruppe (XOAG) wie bei- 
spielsweise aus DE 196 54 593. 1-53 oder DE 102 05 $53.1 bekannt reali- 
siert sein. Die Ansteuerung von Speicher (RAM) und/oder Peripherie (10) 
erfolgt dabei durch die Interf ace-Baugruppe, 

35 

In einer bevorzugten Ausfuhrung kann die ROP-PAE und dabei bevorsugt das 

I I RAM direkt selbstandig Adressen fur das externa RAM und/oder die exter- 

i 
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ne IO und/oder andere interne Speicher (RRAM/IRAM) generieren und exter- 
ne oder interne Datentransf ers selbstandig steuern. Diese Funktion kana 
durch eigenscandige im RRAM iroplementierte Adressgeneratoren realisiert 
warden. Beispielsweise eignen sich DMA- Kent roller basonders fur diese 
Aufgabe, indem sie blockweise Daten zwischen den Speichern kopieren- Der 
Adressraum der zu lesenden Daten und der Zieladressraum wird entspre- 
chend gesetzt und der Kopiervorgang wird gestartet. Das Setzen kann 
durch die IPAE erfolgen. 

In einer aardwaremafcig aufwendigeren Losung kann die Funktion durch eine 
iroplementierte WemoryManagementtTnit (MMtr) realisiert sein. Die Funkti- 
onsweise ist durch den Stand der Tecfcnik definiert und bekannt. zusam- 
mengefafit arbeitet eine MMU wie folgt: 

Der von der MM0 verwaltete REAM Speicher ist in roehrere Seiten (Pages) 
aufgeteilt. Jede Page enthalt Daten eines virtuellen Speicherraumes in- 
nerhalb eines externen Speichers. Beispielsweise konnen die hexadezima- 
len RRAM-Adressen OxOaOO . . Oxuaf f Daten des extemen Speichers an den 
Adxessen 0xbdl3200 . . 0xbdi32f f enthalten. Zur verwaltung der Adressumsefc- 
zung wird eine Adressubersetzungseinheit verwendet, die gewohnlicherwei- 
se durca Lookup -Tabe 11 en realisiert ist. Aufgabe einer MMtf ist es insbe- 
sondere einen grofien Speicherraum auf einen sehr viel Kleineren (in die- 
sem Fall der RRAM) zu uberseteen. Dies geschieht derart, dass Seiten je 
nacii Bedarf von dem grofcen Speicherraum in den Kleiaen kopiert werden. 
Sobald eine Seite nicht melxr benatigt wird kann diese geldscht und/oder 
uberschrieben werden. Wenn die Daten auf der Seite verandert wurden, 
wird die Seite bevorzugt vor dem Los chen/flberschreiben din den groSen 
Speicherraum zuruckgeschrieben. 

Die Adressumsetzungseinheit arbeitet derart, dass ein hoherwertiger Teil 
der physikalischen Adresse (also die Adresse der Seite) in dem Lookup- 
Speicher abgelegt wird und auf die entsprechenden Daten der Seite im 
RRAM zeigt, sobald die Seite innerhalb des kl einen Speichers (RRAM) ver- 
fugbar ist. Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die 
Seite im RRAM iet auch, keine Referenz eingetragen. In diesem Fall muss 
die Seite erst von dem grofcen (extemen) Speicherraum in den RRAM ko- 
piert werden. Hierzu kann eine andere bevorzugt aktuell niche vervendete 
Seite gemafi dem voarstehenden Ablauf uberschrieben werden. 
Das Kopieren kann dabei automat is iert, also ohne wesentliche Beteiligung 
durch den Sequenzer erfolgen, indem von der MMU ein DMA-Kontroller ange- 

30 
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steuert wird. Diesem werden die entsprechenden Seitenadressen im REAM 
und externen RAM, sowie die Seitengrofie durch die MMU zur Verfugung ge- 
stellt (z. B. in Register eingetragen) . 

5 Die ROP-PAE besitzt einen AnschluS an eine Kcrif igurationseinheit die die 
ROP-PAE entsprechend des ublichen Verfahrens konfiguriert und rekonfigu- 
riert. In einer bevorzugten Ausfuhrung kann die CT auf den XRAM lesend 
und/oder schreibend zugreif en, urn Daten und/oder Code fur den Sequencer 
im IRAM zu verwalten. 

10 

In einer besonders bevgrzugten Ausgestaltung kann die ROP-PAE selbstan- 
dig Code fur den Sequenzer uber das PA Bussystem und/oder den EXTBTJS aus 
dero externen RAM laden. 

15 In einer bevorzugten Ausfuhrung ist der IRAM in mehrere Segmente unter- 
teilt, die in unterschiedlichen Adressbereichen liegen. Die Segments 
konnen beispielsweise fur einige der folgenden Funktionen aufgeteilt 
sein: 

Seg^ienzerspeicher, Stack (z.B. fur Regis t ersatz ) , Datenspeicher, Heap, 
20 IO-Puffer r Puffer zu externem BAM bzw. cache, Lookuptabellen, Konfigura- 
tionen fur PAEs und/oder Busse, der Regis tersatz der ROP-PAE. 
Je nacn Funktion konnen dazu folgende Anjsteuermechanismen vorgesehen 
seiii: 

Sequenzer-/Code-Speicher: Programrozeiger auf die entsprechenden Spei- 
„ 25 cherstellen (Rpp) , 

Stack: Stackzeiger auf die oberste Speicherstelle des Stack (Rsp) , gege- 
benenf alls auch ein FraroePointer (Rfp) , wie er nach dem Stand der Tech- 
nik (z.B. Intel Pentium) bekannt ist. 

Konfigurationen fur PAEs und/pder Busse: Hierrauf kann ein Zeiger inner- 
30 halb der CT und/oder - itnplementierungsabhangig ein Zeiger innernalb der 
Konfigurationssteuerung der PAE zeigen, 

Registersatz der IPAE: Sollte der Registersatz der PAE im Speicner un- 
tergebracht aein, wir dieser direkt durch die PAE mit bevorzugt hardwa- 
retechnisah fest vorgegebenen adressiert, 
35 Die restlichen Speicherbeareicba, wi<a Datenspeicher, Puffer, Tabellen 
werden typischerweise durch den Compiler oder Frogrammierer aufgebaut. 
Die Adressierung dieser Bereich erfolgt durch das auszufuhrende Programm 
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und/oder Betrxebssystenu, und wird Wrhalb der Program vnd/oaer Be- 
crxeb ssyst ems, ggf. nater Zubilfanahme der Regx sterS at zes und der ALU 
<tes Sequenzers, berechnet. 

in einer -glieta, variant 1st der IRftM kon5)lett oder teilweise , wie 
bei den IP** bescnrieben, dure* KAM-paes autatai* der R<pp-pab TCali _ 
sxert. ggf. ^erschxedliche se^ente konnen untexschiedliche RAM- 

PAEs verwendet werden. 



In exner bevo rzU gten A usgestal twg k6ime n exnige .der alia SegTOente als 
aktxve Speicher auS3estaltec se±n> also e±ne ^ ^ ^ 

" S ° mit SSlbs ^ — in ode, aus den xhre. Spacer ^ od er nacb 

anderen Spexcbem Oder ^ ipherlegeraten kppieren _ InsbeEOnd ^ s 

axe die ^ cian€ai der Sj?eichsr aug der DB ^ 2e ^ q ^ 2 

15 !el I T Ck ' Raad ° m ACCeSS ' eCC " W ° bei «- i— ~9— : 1~ 

«ln dxe Run^ion *on fi gu ri erba r ^ ^ 

maerbar ist. ^ y ^ m 

' 5 ^/oder bestimmt den Abla^f dGo Seoupn7ov /Iui . sexist 
£iT, rt =^ ^- ^ • ^^^rs/Mxcrocontroaiers. Bevorzuet 

r e^r ;.t ;~ s r n mit ei * er " er ~ 

B. CT aaer andere PAEs) ahnlich ^ bekannten Inter . CT _ 
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Proton. (BB „, „ S72 . 2> DE 2a 3s? ? _ dk 2e ^ ) 

m. »o«™ totelt „ sich „ 6ln . MaiftmmrmM ^ Z 

Prozessoren warden von bsvorzuaf „„„ . Anen 

« J* Dat6n5bertra ^ ist ^scsync^sie^ ^ er die 

ROV/ACK ProtokOlle der Bussyseeme Ala ain b» Bn 

wird dsr » • besonders wesentlicher Aspekt 

™s. ULerzu w ird verwiesea wf DE „ ? Q4 ?2b » ^ ^ 

UHd DE 101 29 237.6-53. 

Brails SCSut , far a , ^ ^ 

2 ZT I <I0 - ch ™-' - - — — m« .uws^ 

oas msbesond^re Daten fiber Pfc , ' 

«icsprecnen, s- B. PCI, RapidIO, Pirewire n<?t» 
paeren Gerate zu ermoglicHen . Gegebenenf all « v- 

—at«« I0A5S (val . „ lss Si ZTTlTTJTT «— — 

PircprxecareB BusprotoJcoll au f eia oder mehrere komT3lM 

OardprotoKclle Obe rset2t werden> ^ «t™ Stan- 
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Akt e : PACT 3 1c - - 

Eb soli besonders darauf hingewiesen werden, dass unter Peripherie auch 
Speicher verstanden werden, wie bei dan bereits aufgezahlten Busproto- 
kollen verdeutlicfcr wird- 

Ebenfalls ist erf indungsgetnaS besonders relevant, dass PAEs auch mehrere 
Anschlftsse an dedizierte Bussysteme aufweisen konnen . 

Desweiteren sind anwendungsabhangig auch Architekturen sinnvoll, bei de- 
nen mir sine Teilmenge der PAEs Anscnlusse an ein dediziertes Bussysnera 
aufweist, oder imterschiedliche PAEs mit einer unterschiedlichen Anzahl 
von Anschlussen an ggf . auch unterschiedl iche dedi2ierte Bus system© auf- 
weisen . 

Die beschriebene Struktur kann durch erweiterte und verbesserte Halblei- 
fcerherstellungsverfahren und -strukturen besonders leistungsfahig imple- 
mentiert werden, indem der Speicher auf dem physikalischen Chip raumlich 
uber oder unter den logischen Funktionen (AU7, Steuerung, Busse, etc.) 
der PAE angeordxiet wird. Hierftxr wird Schutz beansprucht . 
Dazu wird <iber der nach dem Stand der Technik bekannten erst en Halblei- 
terstruktur (z, B- Siliziuro) und der damit aufgebauten Transistorstruk- 
turen eine Oder mehrere weitere Ebenen von Halble iter strukturen (Transi- 
storstrukturen) aufgebracht, die £ttr zusatzliche Funktionen genutzt wer- 
den kannen. Beispielsweise konnen in einer ersten Ebene die lK3gik und 
Getter der PAE-Punktion -und in einer weiteren zusatzlichen Ebene die 
Speicherfunktionen implententiert werden. 

In einer bevorzugten Bauweise werden die einzelnen Halbleiterschichten 
durch eine Isolierschiche vcneiuander getrennt. Die Isolierschicht kann 
Durchkontaktierungen (vias) aufweisen, um Signale zwischen den einzelnen 
Halbleiterschichten zu ubertragen. 

Die verdrahtiongsstruktur kann je nach Anwendung unterschiedlich imple- 
mentiert sein. Beispielsweise kSnnen direkt uber jeder Halbleiterschicht 
Verdrahtungs ebenen und/oder eine globale v er drahtungs ebene, die alien 
Halbleiterschichten sugeordnet ist vorgesehen sein. 

um eine wirtschaf tliche Ausbeute zu erlangen, muss sichergestellt sein, 
dass die Gesamtscnaltung, also alle Halbleiterstruknurebenen zusammen, 
eine ninreichend hohe Ausbeute erreichen. Pesweiteren ist zu beachten, 
dass der Stromverbrauch, also die Ver lust lei stung, aller Halbleiter- 
strukturebenen zusammen innerhalb eines akzeptablen Bereiches bleibt, 
' 34 
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aass die Sili zilimstrukturQii unterschiedli^ ^ -« 

-i. «*«*. _ einer s^^^zizzi: Tr sen ' sodass 

— W_ una, ^ die ^ ^ naChSt - 

ring isc damifc . ^ Verbxndungen vergleicnsweise g e . 

nocn realisxere warden kdnnen. 



35 



19-SEP-2002 16:43 ^^T.HW. P. PIETRUK ^) +49 721 46930B 5.43 

Akte: PACT31C 



Zur Optimierung der Ausbeute kana insbesondere das Redundanzverf ah ren 
nach PE 197 57 200.6-33 angewendet warden. Es soil erwahnt sein, dass 
das Verfahren nach DE 137 57 200.6-33 fur alls PAEs vorgesehen werden 
* kann, also z. B. fur ALU- PAEs genauso wie fur RAM-PAEs. Mit anderen Wor- 
5 ten kdnnen fur- samtliche PAEs das in PE 197 57 200.6-33 beschriebene 
Reduno^mzverfahren angewendet werden. Auch die dortigen Texcverf ahren 
sind implementierbar- 

Fur PAEs mit hauptsachtlich feingranularen Struktursn, also a. B. Spei- 
cher (RAM- PAEs) Oder FPGAs ist es von Varteil, diese feingranularen 

10 Sfcruktuxen mit: einer enteprechand feingranularen Redundant zu versehen, 
d. h. nieht oder niohfc nur die RAM- PAE oder eine eine FFGA-Struktur au£- 
weisende PAE mit einer redundanten PAE zu versehen, sondern die faingra- 
nulare StruJctur selbst mit Redundanz zu verselien. Das heisst, dass bei- 
spielseise den Speicherzellen (bzw. FPOA-Zellen) redundance Speicherzel- 

15 len Cbzw. FPGA-Zellen) zugeordnet warden. Die Verbindungen (Iieitungen, 
Busse, etc.) swischen den jeweiligen Zellen sind dann entsprechend an 
die Erfordernisse einer redundanten Struktur angepafit. Per Aufbau redun- 
danter Struktuxen fur f eingranulare Zellen, vie z. B. Speicher oder 
FPGAs ist durcli den Stand der Technik bereits bekannt. Fur das Vers t and - 

20 nis von Ausgesfcaltungs details wird auf diesen verwiesen. 

Pie Verlustleistung laSt sich nacfc den verfahren von PE 156 51 0*75.5-53 
und PE 101 35 210.7-53 erbeblich minicnieren, wodurch sehr holxe Integra- 
tionsdichten enuoglichc warden. 

25 

Es soil darauf hingewiesen warden, dass die Anzahl der ubereinanderlie- 
genden Halbleitersturkturen keineswegs auf zwei begrenzt ist. Mit fort- 
schrei tender technischer Entwicklung und Optimierung ist eine steigende, 
auch sehr grofie Zahl von ubereinanderliegenden Ebenen realisierbar , 

30 

Die Ebenenaufteilung mufi dabei, weder bei einer zweilagigen, noch bei 
einer mehrlagigen Struktur auf eine ALU- Speicher- auf teilung limitiert 
sein. Bereits bei zweilagigen Strukturen kann es sinnvoll sein den Spei- 
cher susammen mit den ALUs in eine Lage zu legen und die andere Lage 
35 komplett fur die Bussysteme oder die Bussysteme imd to-Ansteuerungen 

(IOAGs) zu verwenden. Die Bussysteme konnen dabai uber die einfache Ver- 
drahtung hinaus bevorzugt auch. die Schaltelemente (Multiplexer, Trans- 
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mission-Gates, etc.) und/oder veratarkerelemente (Treiber, etc.) 

und/ oder Synchronisationselemente (RDY/ACK-Steuerung) , die jeweils Halb- 

leiterstrukturen zu deren Realisierung benotigen entnaltea. 

Desweiteren kann es sinnvoll sein r eine Ebene fiir die Konf igurations- 

speicher und/oder Konf igurationsregister und/oder CT und deren Speicher 

vorzusehen. 

Figur 6 zeigt eine Iimplementierung einer ROP-PAE. Architektoniscfc wurde 
die RAM-PAE innerhalb der AI4J-PAB implement iert - Der gesamte Register- 
sacs (RO-.Rn, Rpp, Rsp f Rfp, Rap) ist in der ROP-PAE untergebracht . Zu- 
griffe auf die Register durch die ALtr sind schnell und mit geringem Auf- 
wand moglich. Adressen und Daten kannen direkt von der ALU an den Spei- 
cher ubertragen werden, olme ein Bus system aufcerhalb der RQP-PAE vie z. 
B. 0105 zu benotigen. 

Bevorzugt weist sine ROP-PAE einen Oder mehrere dedizierte 10-Chaxmel 
zur Datenubertragung mit der Peripherie auf (beispielsweise 0601, 0S02) - 
Datenverbindungen zu den restlichen PAEs konnen vie bereits bekannt 
durch FRBG und/oder BREG realisiert werden. Hier angedeutet durch den 
Leseport 0ff03 und Schreibport 0604. 

Bevorzugt eind ROP-PAEs bereits intern als Sequenzer ausgebildefc und 
weisen damit bereits eine interne Ruckkopplung dee ALU- Aus gangs auf die 
Register auf. Optional kann dies auch durch Sie Verwendung eines ROP-PAE 
externen Busses (z.B. 0105) und einer Ruckkopplung durch ein BREG, wie 
bereits bekannt erfolgen (06 05) . 

Figur 7 zeigt verschiedene Aufbauvarianten von Halbleifcerstapeln ; 
Figur 7a seigt einen einf achen Aufbau mittels Wirebond Verbindungen zur 
Datenubertragung (0701), bei welchen zwei Dice (0702, 0703), also zwei 
Chips, aufeinander montiert sind. Bin chip besteht stark vereinfacht sue 
einer Halb lei ter ebene zur Realisierung von Transistoren (z, B. Silizium, 
0704) , mehreren Metalllagen zur Realisierung von Verbindungsleitungen 
(z. B. Aluminium und/.oder Kupfer; dargestellt sind 3 Lagen 070sa,b,c), 
die jeweils durch eine Isolierschicht untereinander und gegenuber 0704 
elektrisch getrennt sind, und eine obere, besonders widerstandsf ahigen 
isolierschicht 0700 . m die Isoiierscfaichten sind Durchgangsleitungen 
aus Metall zur elektrischen Verbindung der einzelnen Ebenen, sogenannte 
vi as , eingef ugt . 
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In Figur 7b sind die beiden Dices mittels einer Art Flip-Chip- 
Technologie miteinander verbunden, wobei die xibertragung von Signal en 
durch sogenannte Bumps nach dem Stand der Technik erfolgt. Zusatzlich zu 
den durcli die Flip-Cliip-Technologie gegebenen Moglichkeiten des AnschluB 
von Bumps (0711) auf der jeweils obersten Metalllage soll.hier die be- 
sondere erf indungsgemaSe Ausgestaltung gezeigt warden, die Bumps unter- 
halb der Balbleiterschicht (z.B. Silizium) zu kontaktiereu. Dazu werden 
eleKtrische Verbindungen (z.B, Aluminium Oder Kupf er) , also vias (0712), 
durch die Siliziumschicht nach unten gefuhrt. Die Durchfuhrung erfolgt 
bevorzugt durch Atzen von entsprechenden Ldchern in die Halbleiterebene. 
Zwischen den Verbindungen und der Halbleiterschicht wird eine Isolierung 
eingefugt . 

Die Durchfuhrung kann vie bei Figur 7d angedeutet entweder direkt durch 
die Halbleiterschicht erfolgen oder es werden, wie bevorzugt, zunachst 
Wannen (0731) in die Halbleiterschicht geatzt, die mit einer Isolierung 
gefullt warden und in welche dann die Vias eingebracht werden, 

Figur 7c zeigt die besonders bevorzugt e Variante zur Realieierung von 
20 Halbleiteratapeln. Oberhalb der obersten Isolierschicht (0721) einer er- 
sten Halbleiterstruktur, die in diesem Fall dunner ausfallen kann, wird 
eine weitere Halbleiterebene (0 722) auf gebrachc - Dazu wird die Isolier- 
schicht (0722) zunachst durch At sen und/oder Schleifen moglichst eben 
gemacht. Das Aufbringen der Halbleiterschicht kann durch Aufdampfen, 
Aufziehen von Kristallen oder bevorzugt durch Aufkleben Oder klebeahnli- 
chen Verbindungen aufgebracht. Wesentlich, v. a. bei der Verwendung von 
verklebungen ist, dass durch die aufgebrachte Halbleiterstruktur und das 
Verbindungsmaterial (z.B, Klebematerial) durchgeatzt werden kann- Die 
Durchatzung ist erf orderlich, um Kontakte, wie in Fig. 7b beschrieben zu 
den Vias in der darunterliegenden Isolierschicht zu fuhren. 
Die Durchfuhrung der Kontakte erfolgt gemaS Figur 7d 2 . B . durch das 
Einatzen echraaler Kanale, in die ein Isoliermaterial eingebracht wird. 
Danach wird in einem weiteren Schritt in das Isolierovatierial ein schma- 
leres Via eingefugt, indem z. B. zuvor in dem Isoliermaterial ein Loch 
entsprechenden Durchmesaers s. B . durch Atzen erzeugt wurde. 
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Das bevorsugte Verfahren sieht: das Atzan grosser waxuxen (073!) vo r 
welcba mit Isoliermaterial gefOllt warden. i„ die wannen werden ^ 
ggf. mehrere Vias (0712) wi e beschrieben eingefugt. 

Die Figuran 7e,£,g,h 2ei gan V e rB chiedene bcvorzugte funktionale Auftei- 
lungan solder Halblaiterstapel . Die Halbleiterabene i st jewels schra£ _ 
fiert dargesteUt und die Isolierschicht durcb dicke Umrandung. Dazwi- 
schen liegen die MataZllaga. wie ia pig . ?g>h ^ ^ 

station nicht auf 2 stapel beschrankt, eben S o sind groEere stape!, 
z.B. nut 3,4, oder mehr Ebenen mSglich. 

Die m ehxfache bescbriebene Auftrannung *wi scllsrl spaicber ^ ^ iet ^ 
Fig-. 7e dar^estellt. 

Pig- It zaig t die Trennung der Busaysteme ^ den notwandigan Scbaltein- 
beiten und der XO-srruxtur von den ALUs und Spaichem, die si ch in die- 
setn Beispiel in derselben Ebene befinden. 

in Pig. 7g liegen auf der raeersten Ebene die ^ Auf oberster 
l.egen dia Speicher und ggf. die Treiba* der IO. Samit sind dia ScruXtu- 
ren ndt bobar Ve r lu Ee ieis t un g an den 4« Ser an Randaxa da r Stapel unterge- 
bracht. Basonders bierfOr w ird S cbu« b^ruc^t. da dadux-cb aine be- 
nders optima Warmeabfubr mogliob is t . Die Bu.systeme und deran 
Scbalteinheitan sind i„ der mittieren Ebena untergebrache . 
xn dem Beispiel Pig. , h sind ^ den mictlereri verlustlei8tlmgBar _ 
me Busae und Speicbar untargebz-ache . ALTTa und dia basondere energieauf- 
wendigen IO sind zur option Warmeabfubr in den Randern untergabracht: 



XOx-PABs 



A« S DB x« 26 538.0 si nd Speicbar (iomm-pm., einein aadizia.ten 

Anschluss an extarne Binheiten wie z. B . Peripberia und/odar speicher be- 
,0 kannt:. Weiterhin sind aus DB l56 54 5,5.^3 wd DE X02 „ 653 ^ 

Z i e «a Einheiten ( 2 . B. Inrerface-Baugr^pen (XB6) ) z« ra Anschluss von 
extemen Einheiten w ie 2 . B. Peripherie und/odar Spaicher beteannt 
Baide Verfahren weisen das Problem auf, dass ein zusatzlicher Aufwand 

zur DacenkoiuTOUnikatiou zwischen pasr At>^ 

a nen PAEs ' instoesonaere Oatenverarbeicender 

u,C/oder datenh^en^ PAEs un, e ^ rnen Binll ei t .n bet.iebe. werden 
muss, xndem ai« Pa te n eX pli 2it 2wischen ^ pAEs ^ ^ ^ 
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Es vird nunrnehr erxindu^sgenag voxgeschlagea und wie bexeits vcrstehend 
mehxfacn axwabnt beliabig. PAEs, inabasondexa jadoch fur dacanvaxar- 

beifcende und/odex dafeaabexachneada PAEs («. b. ai,u-paes aach DE xss si 
5 075.3-53 . IPAEs , rop-PAEs, und datanspeichaxnda PAEs (RAM-paes aach DE 
loo 50 442.6 ) ei nea oder mehxaxa dediziertea Aaschlusse (lO-Chaaael) an 
axt.xna sinheitaa vie e . B . Paxipaaxxa und/odex Spaxchex vor 2USehea r»a- 
durch xs C eiae dixakte KonrnmaikaticnsmagXxchkeit dar PAEs, die nachfol- 
gaad IO*-paes gananat wexden, und e^exaea Einheicea 3 ^eben. Der vor- 
> taxi dieser Axchx teJ c tlAr l iesrt daxxu, dass aie Vexbiaduag des Arxays aus 
FAB* (PA) mlt dar Pexiphexie {exteraero Speicher IO - Bi ^ eiten) 
axheblich af fxsiantex aufgebau* werdaa fcarnx. D ie bestehenden konfigu- 
rxexbarea Bussyscema dar PAEs uncarexnandax (BUS, mfisaea nicht mit dQn 
lO-DaeanfcxensSexs belastet warden. Sasweitexaa kaaa bax exner entspxa- 
chanden Ausgestalcuag daa xo-chaaaal die Adxessxexung aar Paten fax odar 
aiazelae PAEs sahr vxel ein£achar duxcagafubxt: warden, ala d± as *± tte i. 
des bits moglich ware. 

Dxas kann bavor^gt daduxch xealisier* aeia, da Ss je da an einaa io- 
Chaana! angeschlosseae Binheit eine ei5ene eiadeutlgQ Adresse ^ 
Mitels diesax Adresse kaaa 3 eda Exnhex* expliait ^ einfack _ 

iedt r!"' ^ AdrSSSe ^ X Obextragen wird und 

Dede Exnheit dies© Adresse mi* it,™.^ 

sen ubereinstimmen, ist die Einheit ad«« B ^^. 

* aneic adressiert und dxe Dafcen sind fftr 

diese Einheit bestimmt . 
in alle paes erreicht. s 
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D» XO-«ann. ls kamBn ^ auf ^.^^ e _ 

men » f3eh<>u t ,.!», b. i^b aa o M .„ »ch Ds „, 04 742.4 nd« .1, 

™' *"» *~ n^c « r5jtc an ai e e«ter»=n eintaiten 99 - 

-infacnen <^^ okM ^ st=uerun3 <u. r xo-chann.1* ver- 

staltet sein konnen, ? 

»"-— _>-« «• 1— «ucn s^^^^^ ^ M„ ssabsr . 

AG xmplenierLtiert sein rf-f« x«*. 
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aer Bre:Lt e m derart zerteilt, dafi n ein- 
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zelne Blocks der Breite b s m/a eutstehen. Duxch Konf iguration wird je 
Rechenwerk vorgegeben, ob ein Rechenwerk unserteilt arbeiten soli, ©der 
ob das Rechenwerk in einen oder mehrere Blocke, jeweils gleicher Oder 
unterschiedlicher Breite zerlegt sein soil. Mit anderen Worten kann ein 
5 Rechenwerk auch derart zerlegt sein, daS innerhalb eines Rechenwerkes 

unterschiedliche Wortbreiten zugleich konfiguriert sind (z.B, Breite 32- 
bit, zerlegt in IxlS-, 1x8- und 2x4-bit) . Die Daten werden derart zwl- 
schen den PAEs ubertragen, daS die zerlegten Datenworte (SIMD-WOKD) zu 
Dateuvorten der Bitbreite m zu s ammenge f a&t werden und als Paket uber das 

10 Netzwerk ubertragen werden. 

Das Netzwerk ubertragt immer ein komplettes Paket, d.h. alle Datenworte 
innerhalb eines Paketes r und werden nach dem bekannte Handshake - 
verfahren ubertragen, Binzelne Datenworte innerhalb des Paketes konnen 
dabei auch unbenutzt sein, d.h. keine Information enthalten. Dies kann 

15 durch zusatzliche Statusleitungen und/oder Handshakes ignal en wie z. B. 
dam RDT/ACK Protokoll realisiert sein. 



25 



♦ SIMP BussysteTne 

20 Fur einen effizienten Einsatz der von SIMP-Rechenwerken ist eine flexi- 
ble und ef f iziente Utasorfcierung der SImd-word untereinander innerhalb 
eines Busses oder awischen unterschiedlichen Bussen erf orderlich. 
Die Busschalter nach Figux llkannen derarc modif iziert werden r da£ eine 
flexible vernetzung der einzelnen SIMD-WORD mdglich ist. Da2u werden die 
Busse uber beispielsweise Multiplexer, Busschalter, Transmissiongates, 
Pass -Trans is toren (nachfolgend unter dem Begriff Multiplexer zusammenge- 
fafit) entsprechend den Rechenwerken teilbar ausgelegt, derart daS durch 
Konf iguration die Teilung bestimmt werden kann. Mit anderen Worten wird 
beispielsweise nicht ein Multiplexer der Breite m pro Bus verwendet, 
sondern n einzelne Multiplexer der Breite b m m/n. Es ist nunuiehr m6g- 
lich, die Datenbusse fur b bit Breite zu konf igurieren . Durch die Ma- 
trixstruktur der Busse (Figur 11). ist die T^ortierung der Daten ebeu- 
falls mSglich, wie in Figur 12a dargestellt. 
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Die Handshakes der Busse warden logisch derart verknupf t, dafc ein ge- 
meinsamer Handshake fur den neu geordneten Bus aus den Handshakes der 
ursprunglichen Busse generiert wird. Beispielsweise kann ein RDY fur ei- 

43 
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nen neu sortierten Bus aus einer logischen WD-Verknuprung aller RDYs 
der Da ten fur diesen Bus liefernden Russe generiert werden. Ebenso kauri 
beispielsweise das ACK eines Daten liefernden Busses aus einer UND- 
Verknupfung der ACKs aller Busse generiert werden, die die Daten weiter- 
5 verarbeiten. Prinzipiell sind bsi der Implementierung geeignete Verknup- 
fungen dergestalt zu wahlen, dass diese den jeweils verwendeten Buspro- 
cokollen entspreclxea. 

In einer ersteu Aus fuhrungs variance finden die Verknupfungen der Hands- 
10 hakes innerhalb eines jeden Busknotens start. Dadurch wird es moglich, 
einem Bussystem der Breite m, bestehend aus a Teilbussen der Breite b, 
bevorzugrt nur ein Hand- shake- Srotokoll zuzuprdnen. 

In einer weiteren, besonders bevorzugten Ausgestaltung werden samtliche 
15 Bussysteme in der Breite b ausgestalfcet, die die kleinste realisierbare 
Ein-/Ausgabe Datenbreite b eines SIMD-Word entspricht- Entsprechend der 
Breite der PAE Datenpfade (m) besteht nunmehr ein Ein- /Ausgangsbus aus 
m/b = n Teilbussen der Breite b. Beispielsweise besitzt eine PAE mit 3 
32bit Eingangsbussen und 2 32 bit Ausgangsbusse bei einer kleinsten 
20 SIMD-Wortbreite von 8 tatsachlich 3x4 abit Eingangsbusse und 2x* 8bit 
Ausgangsbusse . ' 

Jeder der Teilbusse weist bevorsugt samtliche verwendeten Handshake- und 
Steuersignale auf , beispielsweise RDY/ACK und der Reconf ig-Trigger nach 
DE 197 04 728.9 und ein globales Reset Signal, etc. 

25 Der Ausgang einer PAE versendet bevorzugt dieselben Steuersignalen fur 
samtliche n Teil-Busse. Eingehende Quinrierungssignale aller Teilbusse 
werden bevorzugt miteinander logisch verknupft, z. B. durch eine UND- 
Punktion. Die Bussysteme kcnnen jeden Teilbus frei verschalten und unab- 
hangig routen. Die Bussysteme und insbesondere die Busknoten verarbeiten 

30 und/ oder verknupfen die Handshake-Signale der einzelnen Busse unabhangig 
ihres Routings, ihrer Anordnung und Sortierung nicht. 

Bei in einer PAE eingehenden Dacen werden die Steuersignale samtlicher n 
Teilbusse derart miteinander verknupft, dass ein allgemeingultiges Steu- 
ersignal quasi als Buss ceuer signal fur den Datenpfad generiert wird. 
35 Beispielsweise konnen in einer "dependend" Betriebsarc RdyHold-Stuf en 

fur jeden einzelnen Datenpfad eingesetzt werden und erst, wenn samtliche 
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RdyHold-Stufen anstehende Daten signalisieren, werden diese von der PAE 
ubernommen . 

In einer "independend" Betriebsart werden die Daten jedes Teilbusses 
einzeln in Eingangsregister der PAIS geschrieben und quittiert, wodurch 
der Teilbus sofort fur eine nachste Datenubertragung frei ist. Das Vor- 
nandensein aller erf orderlichen Daten von alien Teilbussen in den Ein- 
gangsregistern wird innerhalb der PAE durch geeignete logische Verknup- 
fung der fur jeden Teilbus im Eingangsregister gespeicherten RDY-Signale 
detektiert, woraufhin die PAE mit der Datenverarbeitung beginnt- 

Der wesenfcliche daraus resultierende Vorteil dieses Verfiahrens 1st, dass 
die SIMD-Eigenschaf t -von PAEs keinerlei besonderen Einflufc auf das ver- 
wendete Bussystera aufweist. Es werden lediglich mehr Busse (n) einer ge- 
ringeren Breite (b) ben6tigt. Die Verschaltung selbst bleibt uiiberuhrt. 
15 Die PAEs verknupfen und verwalten die steuerleitungen lokal. Dadurch 

entfallt der zusatzliche Hardwareaufwand in den Bussystemen zur Verwal- 
tung und/oder verkmipf ung der Steuerleitungen . 

Figur 11 zeigt einen moglichen und besonders bevorzugten Auftoau einer 
20 Busstruktur fur VPU-Architekturen. Die Ausgabeschaltung einer Funktions- 
zelle 2. B- (PAE , FREG/BREG) (1103, entspricht 0803a,b) ist uber einen 
vertikalen Bus mit deui horizontalen Bussystem (1102. entspricht 0105) 
verbunden. Exitsprechend greifen die Eingabeschaltungen der Funktionszel- 
len (1101, entspricht 0801, 0802) liber einen vertikalen Bus information 
25 nen von dem norizontalen Bussystem ab. In der Figur wird nunmehr ver- 
deutlicht, wie ein derartiger Abgriff , bzw eine derartige Aufschaltung 
erfolgen kann. 

Wie in Fig. 11a dargestellt erfolgt das Aufschalten eines Ausgabebusses 

(1111) von 1103 auf 1102 durch ein "Auftrennen" eines Busses des hori- 
-30 zontalen Bussystems 1102 und das Einfugen von horizontalen Schaltem 

(1112) , die durch Switches, Transmission-Gates, Multiplexer oder ahnli- 
chen geeigneten Bauelementen realisiert sein konnen. Abhangig von dem 
Wert eines Dekoders und/oder Konf igurationsbits (angedeutet durch das • 
schaltersymbol 1113), das entsprechend der bekannten Konf igurationsver- 

35 fahren bevorzugt in einem Konf igura tionsregie ter der PAE angeordnet ist 
und konfiguriert wird, verbindet der Schalter entweder die beiden Half- 
ten des horizontalen Busses 1102 miteinander oder schaltet den Bus 1111 
45 
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auf die eine Halfte von 1102 «uf . die andere Halfte von 1102 ist dana 
unterbrochen und wird nicht weitergeleitet- Die Schaltung v/ird bevorzugt 
fdr jeden Bus des horizontalen Bussystems verwendet. 

Figur lib zeigt die entsprechende Schaltung zum Abgrif f von Daten von 
5 1X02 und zur weiterleitung derer an 1101. Uber vertikale Schalter 

(1122) , die durch Switches, Transmission-Gates, Multiplexer oder ahnli- 
chen geeigneten Bauelementen realisiert sein konnen. werden Daten bit- 
weise von den Bussen des horizontalen Bussystems (1102) abgegriffen und 
auf den vertikalen Eingangsbus (1121) zur Eingabeschaltung 1101 ubertra- 
10 gen. Die Ansteuerung der vertikalen Schalter, d-h. ihre Schaltfunktion, 
erfolgt durch Dekoder und/oder Konf igurationsbits (angedeutet durch die 
schaltersymbole 1123). die entsprechend der bekannten Konf igurationsver- 
fahren bevorzugt in Konf igurationsregistern der PAE angeordnet sind und 
konfiguriert werden. 
15 Fig. lib und bei entsprechender Modifikation auch Fig- Ha lassen n:l 

Datenubergange zu, d.h. mehrere Busse k&nnen zu einera Bus zusammengef aSt 
werden, d.h. die Daten tnehrer Busse werden auf einem Bus zusammenge- 
fuhrt. 

Fig. lie zeigt die Busauf trennfunktion der horizontalen VPU-Bussysteme 
20 (1102) . CJeder horizontale Bus einzeln und je fur sicb kann an der Ausga- 
beseite der PAE-Kante aufgetrennt werden. Eine Auftrennung kann durch 
Multiplexer oder Schalter erfolgen, wie in Figur 11c angedeutet werden 
soil. Je nach Konf igurationsbit 1132, das bevorzugt fur jeden Bus des. 
Bussystems je einzeln zur Verfugung steht. wird die Datenufoertragung auf 

25 das danebenliegende Bussystem (1131) f reigeschaltet oder unterbunden. 

Typischerweisa wird diese Funktion in den Schaltern nach Figur lia rea- 
lisiert, indeta die Information des Konf igurationsbit s 1132 an die Schal- 
ter (1112) des danebenliegenden Bussystems (1131) ubertragen wird und 
entsprechend die Schalter zur Weiterleitung ermachtigt (enabled) oder 

30 die Schalter sperrt (disabled) . 

Figur 12a zeigt ein SIMD-Bussystem entsprechend Figur 11. Dargestellt 
ist ein vereinf achtes horizontales Bussystem 1102, eine PAE Ausgabe- 
schaltung 1103 und eihe PAE Eingabeschaltung 1101. Jade Eingabeschaltung 
35 weist beispielhaft 2 Eingabebvsse der Breite 32 bit auf (1201, 1202), 
jede Ausgabeschaltung 2 entsprechende Ausgabebusse (1203, 1204). Jeder 
der Busse (1201, 1202, 1203, 1204) ist in 4 Teilbusse zu je 8-bit aufge- 
AC 
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teilt, die wie dargestellt jeweils unterschiedlich und unabhanyig gerou- 
tet werden kdnnen, einige der Teilbusse werden nicht verwendet (gepunk- 
tete Linie) . Die flexible Verschaltung wird dadurch erreicht, dass die 
Schalter nach den Figure* ila-c fur jeden Bus derart getrennt aufgebaut 
sind, dass je ein Teilbus von einera Schalter mit eigener Konf iguration 
verwaltet wird, Dadurch ist das Bussystem feingranular verschaltbar - 

Figur 12b zeigt eine SIMD-Datenverarbeitung, bei welcher samtliche Busse 
(1211) dasselbe Handshake (1212) aufweisen. Die Busse werden innerhalb 
einer PAE in die Teilbusse getrennt wd in den SlMD-ALUs (1213, 1214) 
getrennt verarbeitet. Die geraeinsamen Handshakes steuem die Ablauf- 
steuerung (1215) der PAEs an, bzw. werden von dieser generiert. 

Figur 12c zeigt eine SIMD-Datenverarneitung, bei welcher samtliche Busse 
vollkoitvmen getreimt sind (1221) getrennt© Handshakes (1222) aufweisen. 
Die Busse in den SXMD-ALUs (1223 , 1224) getrennt verarbeitet. Die ge- 
trennten Handshakes steuem die Afolauf stenerung (1225) der PAEs an, bzw, 
werden von dieser generiert. 

Einsatz von FPGAs als ALU- core 

In PACT13 ist bex-eits eine Archicektur beschrieben, in welcher anstatt 
einer ALU eine FPGA oder FPGA-ahnliche Stiruktur in eine PAE integriert 
wird- Diese Struktur wird innerhalb einer PAE gemafc den FPGA Konfigura- 
tionsmethoden nach dem Stand der Technik konfiguriert, d. h- die erwei- 
terten Konf igurationsverf ahren nach PACT 02 , 04, 05 , 10, 13, 17 finden 
auf die FPGA-Struktur keine Anwendung. Dadurch sind Aufwand und Kosten 
fur die Konf igurationssteuerung der verba ltnismafcig kleinen FPGA-Zellen 
gering. Die PAE allerdings, die die FPGA-Zellen enthalt, verhalt sich 
geinafi des VPCJ- Konf igurationsverf ahrens nach den o- g. Schriften. Dadurch 
ist die FPGA-Struktur in der PAE-Struktur gekapselt und verhalt sich wie 
ein PAE-Objekt mit vielen Konf igurationsregis tern. 

Dadurch lassen sich auch beliebige Operationen auf ein Array aus FPGAs 
abbilden. Gemafe DE 101 3S 210.7-53 ist eine Mischung aus ALU- PAEs und 
FPGA- PAEs innerhalb einer VPU moglich und durchaus sinnvoll. 
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Es ist anhand des Anwendungsgebietes zu eiitscheiden, ota ein mehrfacher 
Satz an Konfiguracionsregistern ftir die FPGA-Zellen sinnvoll ist, da de- 
ren Anzahl sehr Koch ist. Gegebenenf alls werden Konf igurationsregister 
zum schnellen Unikonf igurieren einer FPGA-PAE gemafi DE 196 51 075.9-53 , 
DE 199 26 538.0 und insbesondere DE 100 28 397.7 Fig- 18 und 19 als 
Register- File Oder FIFO-Sfcruktur innerhalb der PAE realisiert und von 
dort aus in die FPGA-Zellen geladen. 

Es liat sich mittlerweile als besonders vorteilhaft herausgestellt, wenn 
innerhalb einer ALU -PAE eine FPGA struktur der ALU zugeordnet wird, in- 
dein die FPGA- struktur vor und/oder nach und/oder parallel zur ALU ange- 
ordnet wird. Bevorzugt ist eine Ausfuhrung in welcher die FPGA- struktur 
der ALU nachgeschaltet wird. . 

Der Vorteil liegt darin f dass nur relativ kleine FPGA-strukturen verwen- 
det werden mussen, da samtliche arithmetischen Operationen weiterhin in 
der ALU ablaufen. Dadurch wird eine besonders hohe Kos ten/ Performance 
EffUzienz erreicht. Utn kleine Wortbreiten zu unterstutzen (4-bit , 8-bit, 
etc.), bietet es sich besonders an, die vorab beschriebenen siMD-ALUs 
einzusetzen . 

Durch die Nachschaltung von FPGA- Struktur en hinter einer ALU lassen sich 
insbesondere Gorrelatoren und PNG-Generatoren besonders effizient auf- 
bauen. 

Der Einsa'tz von VPU Architekturen bietet sich mittlerweile insbesondere 
fur den Ersatz von ASICs bei mittleren und niederen stuckzahlen an. Die- 
ses Einsatzgebiet der VPU Bausteine weist die Besonderheit auf , dass die 
Applikationsfelder sehr klar definiert sind und haufig nur einige wenige 
Applikationen auf den Bausteinen ausgefuhrt werden, Besonders diese Ein- 
satzgebiete bexi6tigen haufig f eingranulare FPGA-strukturen zur bitweisen 
Verarbeitung von Da ten. 

Durch die Liroitierung au£ wenige Anwendungen sind hier die m6glichen 
IConf igurationen der FPGAs ebenfalls sehr begrenzt und vorhersagbar , 
Es wurde erkannt, dass es beispielsweise insbesondere fur diese Einsatz- 
gebiete lohnend ist, die Rekonf iguration der FPGA- Struktur en von der 
schnellen Rekonf iguration der grobgranularen Strukturen abzusetzten. Mit 
anderen Wox-ten werden fur die FPGAs langsamere (z. B. herkommliche seri- 
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elle) Rekonfigurationsverfahren verwendet, die aufierst kosten- und fla- 
cheneffizient realisierbar siud. 

Dazu kann (l) ©in vollkommen separates Konf igurationssystem bestehend 
aus Bussystem und Konf igurationskontrollern aufgebaut werden, wie dies 
von FPGAs nach dem Stand der Technik bekannt ist. (2) konnen die Konfi- 
gurationsressourcew der VPU Technologie benutzt werden, ohiie dass jedoch 
Ressource fur besondere beschleunigende Massnahmen zur Verfugung ge- 
stellt werden. Beispielsweise kann der Zugriff auf den FILMO nach DE 196 
54 593-5-53 , DE 198 07 872.2 fur FPGA-Strukturen ausgeschlossen sein, 
ebenso wie das Vorhandensein von Konf igurationsregisters tacks nach DE 
100 28 397.7 oder wie nachfolgend beschrieben. Ebenfalls kann die Un- 
terstutzung der schnellen Wave-Rekonf iguration nach DE 199 26 538.0 , de 
100 28 397.7 entf alien. Es ist etwa uioglich, einem FPGA- Array eine PAE 
zur Ulnkonf igurierung zuzuordnen. tfier mufi lediglich die PAE dazu konf i- 
guriert werden, die FPGA-Struktur zu laden f was wie vorstehend beschrei- 
ben, durch PAE-gesteuerten, eigenstandigen Zugriff auf Daten von aulSen 
geschehen kann. 

Insbesondere bietet es sich aus Kostengrunden an- anstatt der mehrfach 
rekonfigurierbaren Architekturen ressourcensparende "einmal konfigurier- 
bare" Architekturen einzusetzen. Die VPU-Bausteine werden dann einmal 
vor ihrer Auslieferung an den Kunden oder beim Kunden bzw. durch den 
Kuxiden personalisiert , d. h. die FPGA-Strukturen werden auf ihre durch- 
zufuhrende Funktion konf iguriert . Die Funktion der FPGA-Strukturen ist 
sodann im weit eren unabanderlich, wahrend samtliche verbleibenden Funk- 
tionen, wie die der ALUs und deren Vemetzung, v/eiterhin vollstandig 
laxifzeitrekonf igurierbar entsprechend der vpU-Technologie ist 
Als "einmal konf igurierbar e» Technologien bieten sich besonders die be- 
kannten ROM, BPROM, EEPROM, FLASH basierenden Verfahren an. Es soli ins- 
besondere erwahnt sein, dass sich die bekanncen Fuse und Aritifuse- 
Verfahren (z,B. Atmel, Actel, Quicklogic) besonders zur Realisierung 
derartiger "einmal programmierbarer" FPGA-Strukturen eignen. 
Auf den prinzipiellen Aufbau derartiger Strukcuren soil hier nicht wei- 
ter eingegangen werden, da dieser durch den einschlagigen stand der 
Technik, insbesondere den patenten der o. g. Firmen, hinreichend bekannt 
ist. 
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Figur 8 zeigt beispielhaf t eine erf indungsgeraaSe PAE. Dargestellt ist 
der Datenpfad der PAE- Die Verbindung zu dem Bussystem 0X05 wix-d durch 
die bevorzugt Register enthaltende Eingabebaugruppe 0801 und 0802 und 
die ebenfalls bevorzugt Register enthaltende Ausgabebaugruppe 0803 rea- 
lisiert. Der ALU (0304) nachgeschaltet ist eine Funktioriseinheit aus 
feingranularen FPGA-Zellen (080S) , die uber einen Busstruktur miteinan- 
der verbunden sind. Der Ausgang von 0804 wird auf dxese Busstruktut auf- 
geschaltet, die Busstruktur wiederum ist mit 0803 verschaltet. Optional 
und bevorzugt kann mittels eines Multiplexers ein Bypass des Ausgangs 
von 0804 direkc auf die Ausgabebaugruppe 0803 an 0805 vorbei geschaltet 
werden . 

In die FPGA-Zellen konnen mehrere Stufen Logik konfiguriert werden, ins- 
besondere samtliche oder einige der folgenden Funktionen = Multiplexer, 
AND, OR, XOR, NOT' Funktionen, Halb- addierer, Vergleicher, Schieberegi- 
ster, Register, Boolsche Lookup -Tabe 11 en. 

Die FPGA-Zellen (0805) kdnnen durctx den Konf igurationsbus (0404) der FA£ 
konfiguriert werden. Bevorzugt werden besondere konf igurationsbeschleu- 
nigende Baugruppen, wie z. B. Konf igurationsstacks (0406) nicht zur Kon- 
figuration von FPGA-Zellen benutzt. Diese Baugxuppen werden ggf . fur 
derartige Konf igurationsdaten passiv geschaltet Oder die Konf igurations- 
daten werden an ihnen vorbeigeleitet - 

in einer besonderen Ausgestaltung ist eine permanente einmalige Konf igu- 
ration der FPGA-2ellen unter Verweridung von ROM-Elementen wie z. B- 
EPROM , EEPROM, Flash-ROM oder Fuse- /Ant if use -Techno log i en vorgesehen. 

Figur 9 zeigt mogliche erf indungsgemalSe Ausgestaltungen von PAEs . Es 
soil ausdrucklich darauf hingewiesen werden, dass die Ausgestaltung in 
Figur 9a und die in Figur 9b auch gleichzeitig zusammen in einer PAE im- 
plement iert sein konnen. 

Figur 9a zeigt den Anschlufi eines Registerfiles (0901) (s.B, R0..Rn) an 
einen ICern (0902), der beispielsweise aus einer ALU wie 0804 oder einer 
ALU (0804) und FPGA-Zellen (0805) bestehen kann. 

Die Ergebnisdaten des Kerns werden zu den Registern 0901 gefuhrt und 
dort je nach Operation e ingespei chert . Die Register 0901 werden uber Mu- 
liplexer (0903, U904) je nach durchzufulxrenden operation auf die Eingan- 
ge der ALU gefubrt. 
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Figur 9b zeigt eine ahnliche Struktur, bei welcher eine zusatzliche Auf- 
schalteinheit (091X) fur einen dedizierten globalen Bus (0912) (z.B. IO- 
Channel) implementiert ist. Die Ergebnisdaten des Kerns werden zu der 
5 Aufschalteeinueit 0911 gefuhrt und dort je nach Operation auf den globa- 
len dedizierten Bus (0912) ubertragen. Fur die PAE bestimmte Dateix von 
0912 werden Uber Muliplexer (0903, 0904) je nacii durchzufOhrenden Opera- 
tion auf die Eingange der ALU gefuhrt. 

Optional kann die Auf schalteeinheit 0911 uber die Busauf schalteeinheiten 
10 0 913 und 0914 Daten direkt von dem Bussystem 0105 lesen Oder auf dieses 
ubertragen. 

Figur 10a zeigt die verwendung von dedizierten globalen Bussystemen in- 
nerhalb eines Arrays aus PAEs (1001) . Insoweit entspricht die Darstel- 

15 lung des PAs aus Figur 1 (0101) . Jeweils eine Menge von PAEs (1001) ist 
an die globalen dedizierten Bussysteme 1002, 1003, X004 angeschlossen 
nnd kann Daten auf diese Senden oder von diesen Empfangen. Die Da ten - 
ubertragung kann sowohl zwischen den FAEs, als auch zwischen PAEs und IO 
stattfinden- Es ist dargestellt/ dass PAEs auch an mehrere globalen de- 

20 dizierten Bussystems gleichzeitig angeschlossen sein k6nnen, wahrend an- 
der e PAEs moglicherweise keinen Anschluss aufweisen. 

Figur 10b zeigt beispielsweise den Anschlufi eines globalen dedizierten 
Busses (beispielsweise 1002 oder 1003 oder 10 04) , der innerhalb des 
Arrays aus PAEs (0101) mit eiuigen PAEs (1001) verbunden ist, an aufier- 
25 halb des 0101 liegende, ggf . auch bausteinexteme Baugruppen- Die Bau- 

gruppen kdnnen beispielsweise Peripherie (1011) und/oder Speicher (1012) 
sein. Zum Anschlufi der aufcerhalb liegenden Baugruppen (1011, 1012) kann 
ggf . eine Anpassung der Signale (z. B. Spannungen: CMOS , TTXj, LVDS, 
etc - ) stattfinden. 

30 

Figur 10c zeigt ein Beispiel fur den Anschlufe eines globalen dedizierten 
Busses (beispielsweise 1002 oder 1003 oder 1004) , der innerhalb des 
Arrays aus PAEs (0101) mit einigen PAEs (1001) verbunden ist, an eine 
Interf ace-Baugruppe (1021) . Die interf ace-Baugruppe ubersetzt die Proto- 
35 kolle und/oder Signale des intemen dedizierten Busses auf einen oder 
mehrere aufcerhalb liegenden Busse. In dem aufgezeigten Beispiel sind 2 
aufcerhalb liegende Busse (1022, 1023) implementiert . Die Bussysteme sind 
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bevorzugt unterschiedlicher Ausgestaltung, beispielsweise kann 1022 ein 
Speicherbussystem fur Speicher (1024) wie SDR-RAMs, DDR-RAMs, RAMBUS 
o.a. sein, wahrend 1023 ein Per ipheriebus system fur Peripherie- und/oder 
XO-Gerate (1025) darstellt, wie z. B. PCI oder ein serielles Protokoll 
5 wie USB, FireWire, Ethernet - 



Konf iguration kotnplexer Rechenwerke 

Komplexe Rechenwerke (z. B. Floating-Point Rechenwerke) kdnnen durcn die 
10 geeignete verschaltung und Gruppierung von konf igurierbaren Zellen 

(PAEs) raoglicherweise aucn unterschiedlicher Bauart (RAM- PAEs r ALU- PAEs, 
Bussen) reallsiert werdea . 

Beispielsweise kann ein Floating-Point Rechenwerk durch eine geeignete 
Verschaltung von raehreren ALU- PAEs, die die arithmetischen Operationen 

15 uber Exponent und Mantis se durchfuhren erreicht werden. Bevorzugt werden 
den ALU-PAEs die in der VPU des Anmelders (XPP-Technologie) integrierten 
Forward- und Backward- Register {FREG/BREG ) zugeordnet, um die notwendi- 
gen Normierungen durch Schiebeoperationen der in den FREG/BREG angeord- 
neten Barrel-Shifter durchzufuhren. Damit lassen sich Floating-Point Re- 

20 ohenwerke bei Bedarf auf Basis der Integer-ALUs mit hoher Flachenef f izi- 
enz aufbauen. 

Ein vorteil des Verfahrens liegt darin, dass keine Silisium-Flache fur 
fest integrierte Floating-Point Rechenwerke verwendat werden muss. Da 
Floating-Point-Operationen relativ zu den Xnteger-Operationen nur selteri 
25 gebraucht wird, steigt damit das Kos ten/Wutz en- Vernal tnis erheblich an. 
Compiler, die Hochsprachenprogramme auf eine VPU ubersetzen, konnen 
durch Makroexpansion und/oder raittels Lauf zeit-Bibliotheken entsprechen- 
de vorgefertigte komplexe Strukturen in den Maschinex^code (z. B- WML) 
ubernehmen, 

30 Fur Maschinencode-Programme (z. B . NML) bieten sich besonders liibrary- 
Calls auf Bibliotheken an, die die entsprechenden komplexen Funktionen 
vorgefertigt enthalten. 



35 Statemachines uber RAM-PAEs 

Mit einem Array aus PAEs verbundene RAM-PAEs kdnnen zum Aufbau von Se- 
quenzern eingesetzt werden. Das Grundprinzip beruht darauf , dass Aus- 
52 
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gangsdaten eines Speichers auf dessen Adresseingang zuruckgekoppelt 
wird. Die Ruckkoppiung erfolgt bevorzugt uber ein taktgesteuertes Regi- 
sters. Dadurch entsteht ein Sequenzer, dessen jeweils nachf olgender Zy- 
klus durch den jeweils aktuallen Zyklus vorgegeben ist. 
5 Teile der Ausgangsdaten (CONTROL- Signale) k5nnen uuramehr an andere Bau- 
gruppen und/oder Funktionszellen (PAEs) und/oder auch an externe Gerate 
uberfcragen werden, um dorc besfcimmte Vox-gange auszulosen. Besonders be- 
vorzugt sind zwei Ubertragungsarten, die zumeist gemeinsam angewendet 
werden : 

10 a), die xJbertragung uber einen Datenbus, bevorzugt inbesondere als SIMD- 
Bus gemafi der vorstehenden Erlauterung ausgestaltet, wodurch eine teil- 
weise Ubertragung der Ausgangsdaten besonders effizient realisierbar 
ist. 

b) die fifbertragung uber einen Triggerbus, dessen bevorzugte Ausgesfcal- 
15 tung land Arbeitsweise in PACTOB beschrieben ist. Ober Xriggerbusse kon- 
nen Zustande und Bedingungen zur Ablauf steuerung von Baugruppen und/oder 
Funktionszellen (paes) und/oder auch externen Geraten besonders effizi- 
ent ubertragen werden. 

20 Per Aufbau dear Eingangsadressen, bzw. Ausgangsdaten ist wie 
f olgt (Darstellung: hoherwertige Bits ... niederw'ertig Bits): 
Adresse: 

Adresse des aktuellen Zyklus 



Daten t 



Adresse des nachsten Zyklus 



CONTROL-Signale 



Es bleibfc zu erwahnen, dass die Eingangsdaten typischerweise nicht ver- 
wendet werden, d.h. auf den Speicher wird nur lesend, nicht schreibend 
zugegriffen. Der inhalt des Speichers (z.B. RAM-PAE) wird durch eine 
Konf igurationseinheit vorkonf iguriert . Deshalb kami der Speicher Ansbe- 
30 sondere auch als nichtf liichtiger einmal programmierbarer- Speicher mit 
ROM, EPROM, EEPROM, Flash Zellen oder basierend auf Fuse Oder Antifuse 
Techno logien aufgebaut sein, Der Speicher wird dann, wie vorab bereits 
beschrieben, vor der Auslief erung an den Kuxuden oder beim Kunden perso- 
nalisiern:, d.h. programtniert . 
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Bin Speicherzugrif f durch andere PAEs ist griindsatzlich. m6glich, urn den 
Sequenzer z.B, im Betrieb zu tuodif izieren, soil aber aufgrund des be- 
grenzten Einsatztaereichs hier niche weiter detailliert ausgefuhrt wer- 
den. 

Der erfindungsgemaSe Sequeiizer kann durch folgende Erweiterungen in sei- 
ner Abfolge von zyklen auf Ereignisse reagieren uiid insbesondere beding- 
te Sprunge durchf uhren : 

Ein Teil, bevorzugt der niederwertige, der Eingangsadressen zu dem Spei- 
clier wird als Eingang fur weitere Zustandssignale verwendet. Diese Zu- 
scandssignale konnen durch die vorstehenden ubertragungsarten ubertragen 
werden und somit Da ten Oder Trigger ©ein. Bei der Selektion des na.chfol- 
genden 2yklus wird ixunmehr eine mogliche Menge von Zyklen durch die Da- 
tenrftckkopplung au£ die bevorzugt hohen Adressbits bestiramt und der be- 
stiramte zyklus wird darm aus der uiSglichen Menge durch die zustands- 
signale auf den niederen Adressbits selektiert- 

Daraus resultiert folgender Aufbau der Eingangsadressen, bzw. Ausgangs- 
daten wie folgt (Darstellungz hdherwertige Bits ... niederwertig Bits) : 
Adressei 

2us t andss ignale 



Adresse des aktu- 
ellen Zyklus 



Datem 



Adresse des nachsten zyklus 



CONTROL- Signale 



Somit ist ein vollwertiger Sequenzer definiert, der den Grundprinzipien 
der Mealy-Moore Sequenzern entspricht. 

Die zustandssignale. und/oder .Control-signale konneu nuninehr ggf . zu B£in- 
deln zusammengef afit derart grui«>piert werden, dass je eine Gruppe be- 
stimmten Sendern/Empf angern zur Verfugung stelxt, z.B. eine Gruppe fur 
0101-interne PAEs und eine Gruppe fur extents Baugruppen und eine Gruppe 
zur Konf igurationseinheit . 
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Mit anderen Worten werden samtliche Sprunge durch die Angabe der "Adres- 
se des n&chsten Zyklus" realisiert. Bedingungen werden durch die Zu- 
standssignale realisiert . 



10 



15 



Das dabei auftretende Problem ist, wie sog. dou^t cares, also bescimmte 
Zustandssignale, deren Wert zu einera Zyklus bedeutungslos ist, behandelt 
werden. Die bevorzugte Variance liegt darin, fur samtliche moglichen 
Werte dieselben Daten festzulegen. 
Beispiel : 

Innerhalb einer folgendermassen aufgebauten Adresse 



Adresse des aktu- 
ellen Zyklus 



Zustandssignale 



soil die "Adresse des aktuellen Zyklus" (Cycle) beispielhaft gleich 
0x60, entsprechend CYCLE60 sein. Es sind 4 Zustandssignale (ZSO- -3) vor- 
gesehen, von denen innerhalb des beispielhaf te Zyklus" 2 (ZS3 und ZS1) 
je nach Wert zu anderen Sprungsielen fuhren, also beispielhaf t nach CY- 
CLE10, CYCLE 7/ CYCLES 9 , CYCLES 6 . 
Die Tabelle sieht nunmehr wie folgt aus: 



Adresse 


Daten 


cycle 


ZS3 


ZS2 


ZS1 


ZSO 




CYCLE 6 0 


0 


? 


0 


? 


CYCLE10 


CYCLE 60 


0 


? 


1 


? 


CYCLE 7 


CYCLE60 


1 


? 


0 


? 


CYCLE 8 9 


CYCLE 60 


1 




1 


? 


CYCLES 6 



20 Die don't cares (ZS2, ZSO) werden nunmehr so belegt, dass der Wert ihres 
Signales keinen Einflufc auf die Zuordnung der Adresse zu den Daten hat: 



Adx-esse 


Daten 


Cycle 


ZS3 


ZS2 


2S1 


ZSO 




CYCLE 6 0 


0 


0 


0 


0 


CYCLE10 


CYCLES 0 


0 


0 


0 


1 


CYCLE10 


CYCLE 60 


0 


0 


1 


0 


CYCLE 7 


CYCLE 6 0 


0 


0 


1 


1 


CYCLE 7 
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CYCLE 60 


1 


0 


0 


0 


CYCLE 8 9 


CYCLES 0 


X 


0 


0 


1 


CYCLE 8 9 


CYCLES 0 


1 


0 


1 


0 


CYCLE 5 6 


CYCLE $0 


1 


0 


1 


X 


CYCLES 6 


CYCLE 60 


0 


1 


0 


0 


CYCLE10 


CYCLE 60 


0 


1 


0 


X 


CYCLE10 


CYCLES 0 


0 


1 


1 


0 


CYCLE 7 


CYCLE 60 


0 


1 


1 


X 


CYCLE 7 


CYCLE 60 


1 


1 


0 


0 


CYCLE 8 9 


CYCLE 60 


1 


1 


0 


X 


CYCLES 9 


CYCLE 60 


X 


1 


1 


0 


CYCLES 6 


CYCLE 60 


1 


1 


X 


1 


CYCLE 5 6 



Jeder ZieXzyklus ist rruntnehr 4-fach gespeichert, entsprechend aXlen bi- 
naren Kombinationsmoglichkeiten der don't care, 

5 Eine weitere optionaXe, afoer sinnvolle und daher bevorzugte AusgestaX- 
tungsmogXichkeit des Sequenzers siehfc einen 2usat«lichen Teilbereich der 
Ausgangsdaten fur eine Seiektor- und/oder VergXeichsmaske fur die Zu- 
standssignaie vor. Bei der Verwendung aXs Selektor konneii z.B, durch die 
Ansteuerung von MultipXexem durch die Selektorraaske eine Teilmenge von 

10 Zustandssignalen aus mehreren mogiichen ausgewahXt warden, pie zusatjaXi- 
die optionaXe VergXeichemaske kann aXs Vergleiclisoperator fiir einen Ver- 
gieicher dienen, der entsprechend ein Statusbit (gXeic*i/nicht gleich) 
aus einer Menge von Statusbits generiert. EbenfaXXs kann die Vergieichs- 
maske zur Deselektion von don't care Signalen dienen, z.B. uber eine 

15 normale Maskenoperation durch. Veruridung nach dem Stand der Technik (sie- 
he PACT10) . 

Der Aufbau der Ausgabedaten ist dann wie foigtr 
20 Da ten: 



Adresse des naclisten 


CONTROL- Signale 


Selektor/Vergleicbsmaske 


ZyJclus 







Ein bevorzugter Sequencer kann beispielsweise wie folgt aufgebaut sein: 
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Der Adressbus einer RAM-PAE, die als Sequenzerspeicher verwendet wird, 
wird in ruehrere Teiladressen beliebiger und insbesondere rooglicherweise 
auch unterschiedlicher Breite aufgeteilt, beispielsweise Bit 0. .3 fur 
eine erste Teiladresse (NEXT_CYCLE) , Bit 4^.7 fur eine zweite Teiladres- 
5 se (SEQ_IW) und Bic 8.. 12 fur eine dritte Teiladresse (CTRL._IN) . 

Der Datenausgang einer RAM-PAE wird in rnehrere Teildaten beliebiger und 
insbesondere moglicherweise auch unterschiedlicher Breice aufgeteilt, 
beispielsweise Bit 0..3 fur die ersten Teildaten (CYLCE) , Bit 4.-7 fur 
die zweiten Teildaten (SEQJDUT) und Bit 8.. 12 fur die dritten Teildaten 
10 (CTRI,_OuT) . 

Zur Aufteilung der Adressen und/oder Daten kann insbesondere das be- 
schriebene SIMD PAJ3- und Bus-Konzept verwendet werden. Weiterhin kann 
die Auftrennung innerhalb der RAM-PAE erfolgen. 

15 

Der RAM-PAE konnen datenverarbeitende PAEs zugeordnet werden, wie z. B . 
ALU-PAEs. 

Die Pestlegung des nachsten Zyklusses innerhalb eines Sequenzerdurch- 
20 laufs erfolgt durch die Ruckkopplung von NEXTJTYCLE auf CYCLE. 

In einer erweiterten Ausfuhrungsvariante konnen zusatzliche datenverar- 
beitende PAEs zur Berechnung von CYCLE in Abhangigkeit von NEXT_CYCLE 
innerhalb der Ruckkopplung vorgesehen sein. Diese PAEs konnen auf belie- 
25 bige, insbesondere auch zus&tsliche Signale r Daten Oder Zustande ande- 
rer PAEs und/oder externer/ peripherer Baugruppen reagieren. Desweiteren 
konnen diese PAEs zusatzlictie Signale Oder Daten erzeugen. 

Zur Realisierung eines erweiterten Sequencers konnen weitere PAEs ange- 
30 koppelt sein, die in einer moglichen Ausgestaltung auch in ihrer Funkti- 
on und/oder Vernetzung vom Sequencer beeinflu£t werden konnen,- Dazu kann 
der Sequenzer Daten in die Konf igurationsregister der entsprechenden 
PAEs ubertragen. Bin zugriff auf die Konf igurationsregister kann bei- 
spielsweise durch die in DE 137 04 728.9 beschriebene Architektur er- 
35 folgen (vgl . DE 197 04 728.9, Pig. 4). Die angekoppelten PAEs verarbei- 
ten vorwiegend Daten beliebiger Art und besitzen Anschlufi an weitere 
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PAEs, insbespndere datenverarbeitende (ALU-PAEs) und/oder speicher-PAEs 
(RAM-PAEs) und/oder periphery Anschlusse (10-PAEs) . 

Diese PAEs kOunen durch die durch SEQ_OUT dargestellten Control -Signale 
angesteuert werden und kdnnen bedarfsweise durch die an SEQ_IN geleite- 
5 ten Zustandssignale Afolaufspeicher des Sequenzers ansteuera. 

Weitere moglicherweise auch unabhangige PAEs Oder Einheiten, insbesonde- 
re auch exteme/periphere Einheiten und/oder tibergeordnete CTs konnen 
10 durch den Sequenzerspeicher entsprechend SEQ_IN/OUT. aagesteuert werden 
(CTRI>__OUT) oder dieaen ansteuern (CTRL_IN) . 

Sur korrekten taktgesteuerten Ablauf steuerung des Sequenzers sind in 
15 Ruckkopplungspfade bevorzugt taktsynchronisierte Register eingebaut. 

Die RAM-PAE kann durch eine ubergeordnete Konf iguracionseinheit konfigu- 
riert werden, insbesondere konnen die Sequenzei-funktionen durch den In- 
halt der RAM-PAE konfiguriert und festgelegt werden. 

20 

Figur 15 zeigt ein Ausgestaltungsbeispiel eines erf indungsgemafien Se- 
quenzers basierend auf einer RAM-PAE. Ein Teil (1505) des Datenausgangs 

(1502) eines Speichera (1S01) ist uber ein taktgesteuertes Register 

(1503) auf den Adresseingang (1504) des Speichers zuruckgekoppelfc . Der 
25 Adresseingang (1504) entspricht somit CYCLE und 1505 einem Teil, bevor- 
zugt dem Hoherwertigen, von NEXT^CYCLE. 

Optional kann ein Teil (1508) des Datenausgangs (15Q2) an eine Selektor- 
Maskeneinheit (1509, 1510) gefuhrt werden, in welcher die vom Bussystera 
30 0105 als Daten und/oder Trigger eingehenden SEQ_XW (1511) bzw. CTRLJQT 
(1512) Daten verarbeitet werden. 



CTRIi_in und SEQ_iit und/oder deren in der Selektor-Maskeneinheit verar- 
beitete Werte werden zu 1505 dazugemischt (1513), bevorzugt derart, dass 
1505 den hoherwertigen Adressteil und CTRL_IH/SEQ_IN den niederwertigen 
bilden . 
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Der verbleibende Teil des Datenausgangs (1502) kaim in einen SEQJDUT- 
(1506) und CTRIi_ODT (1507) Teil aufgetrennt warden und uber die Ausgabe- 
baugruppen 0803a, b als Daten und/oder Trigger auf das Bussystem 0105 ge- 
fuiirt . 

5 

Verscniedene Konf igurationsregisterwodelle zur Fesfclegung der Konfigura- 
tion von jeweils lokal zugeordneten PAEs sind bekannt. In PACT02 ist ein 
sequentiell abarbeitbares Modell beschrieben, in PACT 04 ist ein FIFO- 
Modell bescnriefoen, das ebenfalls sequentiell abgearbeitet und uberlap- 

10 pend konfiguriert werden kanri, in PACT08 ist ein selektives Model!' be- 
schrieben, foei welchem abhangig von der Datenverarbeitung bestitnmte Kon- 
figurationsregister und damit die in ihnen gespeicherte Funktion 
und/oder Vernetzung ausgew&hlt werden. in de 100 28 397.7 ist weifcerhin 
ein FIFO-Modell beschrieben, das sich besonders fur die Vorabkonf igura- 

15 tion und uberlappende Konfiguration eignet. 

Als besonders leisfcungsf &hig und Kos ten/ Performance effizient wurde eine 
Mischung aus diesen Modellen erkannt. 

20 Das FIFO-Modell nach DE 100 28 397.7 eignet sich besonders, um eine 

beliebige Anzahl von Konf igurationsregistem von PAEs vorzuladen, da die 
Funktion des verwendeten FIFOs eine variable Konf igurationslange eff izi- 
ent ermoglicht. Hierzu wird jeder PAE ein lokaler FIFO-Speicher zugeord- 
net, der die Konf igurationen seiner zugeordneten PAS verwaltet und puf- 

25 f ert . 

Durch eine Erweiterung, wie z. B . die nachfolgend beschriebene, des FI- 
FO-wodelles kann der Anfang und das Ende. einer bestimmten Konf iguration 
und der dazugehorenden einzelnen Konf igurationseintrage festgestellt 
30 werden- Nunmehr konnen mehrere Konf igurationen zugleich in.dem FIFO- . 
Modell abgelegt werden. 

Als besonders geeigneU zur Kermzeichnung des Anfangs oder Endes von Kon- 
f igurationen haben sicli die zwei nachfolgend beschriebenen Verfahren 
35 herausges tellt : 
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a) Kennzeichnung durch zusatzliclie Bits (CycleBits) in jeder Speicher- 
zelle: Oedem Konf igurat ions e in t rag werden zusatzliche Bits zugeordnet, 
die den Beginn und/oder das Ende einer Konf iguration kennzeichnen. Bei- 
spielsweise kann ein Eintrag im FIFO wie folgt aussehen: 



Bit 0. -IS 


Bit 16 


Bit 17 


Konf igurat ionswort 


0=don> t 
care 

l=Beginn 


0=don't 

care 

l^Ende 


Da bevorzugt nach dem nachfolgend beschriebenen Verfahrea direkt auf den 
Beginn von Konf igurationen gezeigt werden kann, wird bevorzugt auf die 
Anzeige deB Beginns verzichtet: 


Bit 0. .15 


Bit 16 




Konf igurat ionswort 


0=don't 

care 

l=Ende 



10 b) Besonders eff izient kann die Kennzeichnung durch besondere Konfigura- 
tionsworte sein, die als Befehle dekodiert werden; 

Bestimmte Bitkombinationen innerhalb des Konfigurationswort.es werden als 
Befehle dekodiert und erkannt: 

Beispielsweise kdnnten die folgenden Befehle implementiert sein: 
15 BEGIN i Beginn ,einer Konf iguration 
END : End© einer Konf iguration 

Dieses Verfahren ist erheblich flexible* und leistungef ahiger als die 
Kennzeichnung durch CycleBits. 

Zur einfachen Unterscheidung von Befehlen und Konf igurat ionen kann ahn- 
20 lich den CycleBits ein Bit vorgesehen sein, das durch seinen Wert die 
Semantik der Konfigurationswortes bestimmt, beispielsweise wie folgt: 



Bit 0. .15 


Bit 16 


Daten 


(^Interpretation der Daten als 
Konf igurat ionswort 
lalnterpretation der Daten als 
Bef ehl 



Eine Konf iguration wird je Aufruf von ihrem Anfang bis 2U ihrem Ende in 
die Konfigurationsregister einer PAE ubertragen. 
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Durch eine optionale zusatzliche Uborsetzungs- und Zuweisungsvorrichtmig 
konnen Zustande (z.B. Zustande der eigenen ALU und/oder ein oder mehxere 
Trigger (vgl. de 137 04 720.9 ) beispielsweise anderer PAEs) auf be- 
5 stimmte Konf igurat ionen innerhalb des FIFO-Modells ubersetzt werden. 
Beispielsweise kann ein eintref fender Rekonf igurations trigger auf eine 
bestimmte Konf iguration innerhalb des FIFO-Modells zeigen, die durch das 
Auftreten des Rekonf igurationstrigger dann konfiguriert wird. 

10 Als Ubersetzungs - und Zuweisungsvorrichtung k6nnen beispielsweise alge- 
braische Berechnungen und/oder logische VerknupEungen und/oder bevorzugt 
Dbersetzungsspeicher ( Lookup -Tabellen) zum Einsatz kommen. 

Eine besonders bevorzugca Variants ist in Figur 14 dargestellt und ar- 

15 beitet wie folgb: 

Eine Kette voh Addierern wird derart miteinander verbunden, dass das Er~ 
gefonis (SUMME) eines vorherigen Addierers (p) an einen iiachfolgenden Ad- 
dierer (p+1) als Operand weitergeleitet wird. Die Weiterleitung kann 
derart unterbrochen werden, dass anstatt des Ergebnisses eine 0 (Null) 

20 weitergeleitet wird, 

Als zweiter Operand ist jedem Addierer jeweils ein eigenes Registers zu- 
geordnet, dessen Wert jeweils zur SUMME der vorherigen Stufen addiert 
wird . 

tfede der Stufen reprasentiert eine Konf iguration im Konf igurat ions - FIFO , 
25 in dew Register der jeder Stufe ist die relative startposition einer 

Konf iguration gespeichert. Die absolute S tartposition la£t sich berech- 
nen, indem samtliche relative Startpositionen sich unterhalb im FIFO be- 
findenten Konf igurat ionen auf addiert wird. Dies geschieht durch die Ad- 
diererketten. 

30 wit anderen Worten ist die relative Position als unterste Konf iguration 
im FIFO diejenige, deren Eintrag am Nachsten sum Ergebnisausgang der Ad- 
diererkette gespeichert ist. Sodann folgen alle weiteren relativen Posi- 
tionen gemafi ihrer Anordnung im FIFO. 

Die Kette wird an der Stelle durch einschleusen einer Null anstelle der 
35 SUMME unterbrochen, bei welcher die relative Position der selektierten 
Konf iguration erreicht ist. 
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Das Ergebnis 1st nunmehr der Offset zwischen dem Lesepointer des FIFOs, 
der auf die unterste Konfiguration zeigfc, und der Startposition der se- 
lektierten Konf iguration. 

Somit ist die Sprungadresse zur selektierten Konf iguration einfach durch 
Addition von Zeiger und Offset berechenbar. 

Die Auswahl der selekcierten Konfiguration kann durch unterschiedliohe 
Verfahren in der Obersetzungs- und Zuweisungseinrichtung erfolgen. 

(a) Die eingehendea Trigger kdnnen priorisiert und dekodiert warden. 

(b> Die eingehenden Trigger werden uber eine Lookup-Tabelle ubersetzt 
und danach moglicherweise priorisiert und dekodiert. 

(cj Bs der Menge aller Trigger werden einige ausgewahlt, Z .B. Qber Mul- 
tiplexer, die sodann entsprechend (a.b) weiterverarbeitet werden . 

Es soli besonders darauf hingewiesen werden. dass ein Trigger auch ein 
Vektor (TRIG-V) sein kann, wie in PACT08 beschrieben. Der Vektor selbsc 
kann zur weiteren Dekodierung verwendet werden, d.h. der Vektor selek- 
tiert die Konfiguration. Dies 1st insbesondere dann wichtig, wenn eine 
Wave -Rekonf iguration nach Pactos. PACT13, PACT 17 durchge£uhrt werden 
soil, bei welcher bevorzugt ein mit den Daten ubertragener Trigger- 
Vektor die nachste Konf iguration selektiert. 



flach Oder wthrend der Konf iguration konnen Konf igurationen aus dem FIFO 
encfemt werden. Bevorzugt wird dabei die Ref erenzierung innerhalb der 
Obersetzungs- und Zuweisungsvorrichtung entsprechend angepasst. 

weiberhin kann das FXFO-Modell urn das Sequenzer-verfahren nach DE 196 54 
846.2-53 oder bevorzugt das vorstehend beschrieben erweitert werden. 
DaZ u werden beispielsweise sprunge (GOTO) , sowie zustandsabhangige und 
bedingte Sprunge (WAIT-GOTO, IF-GOTO) eingeftthrt. Sprunge konnen durch 
besondere CycleBits reprSsentiert werden, oder bevorzugt als Befehle im- 
plementiert sein. 

Weiterhin kann e in Synah^onisationaanaeigeverS ehren verwendet werden, 
das anzeigt, wann eine bestimmte Konf iguration bzw. ein bestimmter Zy- 
klu S aes seguenzers beendec ist. Hit anderen Morten kann jeder Zyklus 
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aus mehreren Konf igurationseintragen bestehen. Zur Kennzeichnung kann 
beispielsweise nach DE 156 54 846.2-53 ein run/stop-Flag verwendet wer- 
den, wobei 'run' zrusammengchdrende Konf igur at ions eintrage eines ZyKlus 
kennzeichnet und 'stop 1 den ersten Eintrag eiues nachf olgenden Zyklus; 
alternativ ist ist die Verwendung der vorstehend beschriebenen CycleBits 
moglich, die zwar sine etwas andere Semantic aufweisen, sich aber an- 
sonst gleich verhalten. 

Alternativ oder znsatzlich zu diesen Verfahren konnen auch die eben- 
falls. au 5 pact 04 bekannten Befehle wait und BEGIN Oder bevorzugt die 
vorstehend beschriebenen Befehle BEGIN und END verwendet werden. 
Durch 'stop' oder wait Oder END wird das Ende eines Zyklus gekennzeich- 
net ' d - h - Konf igurat ion ist komplett, kann ausgefuhrt und abgear^ 

beitet werden. Nach Beendigung der Datenverarbeitung dieser Konfigurati- 
on wird der nachste Zyklus ausgefuhrt. 

Die Beendigung kann entsprechend sequentieller Prozessoren durch einen 
Takt ( Ins trukt ions sequenzing) definiert sein, und/oder entsprechend des 
Datenverarbeitungsprinzips der PACT- Prozessoren (P 44 16 881.0-53 , de 
196 54 846.2-53 , Konf ignrations sequencing ) durch ein statussignal (z. 
b. einen Trigger) definiert sein. 

Mit anderen Worten wird z.B. kann durch das Eintreffen eines Triggers 
'stop' vibersprungen werden und die nachf olgenden Konf igur at ionen konfi- 
guriert werden. Alternativ oder zusatzlich kann der Befehl WAIT einge- 
setzt werden, der auf das Eintreffen eines Triggers. 

Optional kann ein FIFO niche nur die lokal zugeordnete PAE ansteuern, 
sondern auch weitere umliegende PAEs. 

Optional kann der FIFO auch als eine dedizierte Einheit nach DE 196 54 
Q4 6.2-53 ausgestaitet sein. 

Ausf uhrungsbeispiele : 

A) Ein ©intreffendez- Trigc^ wi*-d ub«r eine Ufoersetsungs- und Zuwei- 
sungsvorrichtung auf eine im FIFO liegende Konf iguration (Kl) ubersetzt. 
Die Konfiguration (Kl) wird daraufhin in die PAE konf iguriert. Als Ende- 
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Kennung kann beispielsweise ein WAIT-Befehl, ein END-Befehl oder das 
run/stop-Flag dienen. 

Ein nachfolgend eintref fender Trigger wird uber eine Obersetzungs- und 
Zuweisungsvorrichtung auf eine andere im FIFO liegende Konf iguration 
(K2) ubersetzt. Diese Konf iguration (K2) wird daraufhin in die PAE kon- 
f iguriert . 

Kl und/oder K2 konnen nach erfolgter Konf iguration in die PAE aus dem 
FIFO geldscht werden. 



B) Ein eintref fender Trigger wird uber eine ubersetzungs- und Zuwei- 
sungsvorrichtung auf eine im FIFO liegende Konf iguration (K3) ubersetzt, 
die aus mehreren Zyklen (Cyl, cy 2 , Cy3a, Cy3b, Cy4> besteht. Der erste 
Zyklus (Cyl) wird daraufhin in die PAE konf iguriert und ausgefuhrt. Als 
Ende-Kennung kann beispielsweise ein WAIT-Befehl oder das run/stop-Flag 
15 dienen. 

.Ein nachfolgend eintref fender Trigger, der das Ausf uhrungsende des Zy- 
klus anzeigt, bewirkt die Konf iguration und das Ausfuhren von Cy2. Cy2 
endet mit zwei WAIT-GOTO-Bef ehlen (WAIT-GOTO (Trgl, Cy3a) WAIT-GOTO 
(Trg2, Cy3b) ) (vgl. PACT04) , dies bewirkt, dass auf zwei unterschiedli- 
che Trigger, die das Ausf uhrungsende des Zyklus anzeigen, Trgl und Trg2 
reagiert wird. Trififc Trgl ein, wird im nachsten Zyklus Cy3a konfigu- 
riert und ausgefuhrt bzw. bei Trg2 entsprechend Cy3b. 



cy3a und Cy3b enden mit einem WAIT-GOTO (Trg, Cy4) . Bei eintreffen eines 
Trigger, der das Ausfuhrungsende des zyklus anzeigt, wird nach Cy4 ge- 
sprungen und die Konf iguration entsprechend konf iguriert und ausgefuhrt. 

Cy4 endet mit einetn WAIT-GOTO (Trg, Cyl) , wodurch bei eintreffen des 
Trigger, der das Ausfuhrungsende des Zyklus anzeigt, der emeute sequen- 
tielle Durchlauf einer Schleife beginnen kann. Insoweit kann durch den 
Sprung auf Cyl ein Ringspeicher nach DE 19S ba 846.2-S3 xum Avsfubren 
von Schleifen gebildet werden. 

Durch Eintreffen eines Triggers (Trg-x) kann die schleife terminiert 
warden . 

Existiert ein Einfcrag fur Trg-x in der Obersetzungs- und Zuweisungsvor- 
ricntung kann die Schleife jederzeit abgebrochen und die durch Trg-x in 
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der Ubersetzungs- und Zuweisungsvorrichtung referenzierte Konf iguration 
(KX) ausgeftthrt werden. 

Existiert kein Eintrag, kann durch das explizice Verwenden von WAIT-GOTO 
(Trg-x, KX) Befehlen, z.B. zusammen mit WAIT-GOTO (Trg, Cyl) in Cy4 die 
Schleife zu bestimmte vorgegebenen Ausfuhrungszeitpunkten terminiert 
werden. 
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Figur 13 zeigt beispielhaft einen Aufbau eines Konf iguration3busse$ zur 
Konfiguration von PAEs (1001) durch eine KonfiguratiouseinheiU (0106) . 
Die Konfiguratxoiiseinheit sendet Konf igurationsdaten uber ein Bussystem 
1301 und ggf- uber mehrere Regis terstuf en (1303, 1304) zur Verbessemng 
des Frequenzverhaltens und uber den Konf igurationsdatenbus (0404) an die 
PAEs 1001. Jede PAE dekodiert die angelegten Adressen und reagiert, so- 
fem sie selektiert wurde, auf die Datenubertragung des Busses. PAEs 
kdnnen. ihrerseits Daten uber 0404 uber die Regis ter-Multiplexer-Stuf en 
13 04 auf das Bussystem aufscnalten und die Konf igurationseinheit oder 
optional andere PAEs senden. Dies geschieht jeweils durch Ubertragung 
der Adresse der Empf angseinheit . 

Die Ruckiibertragung der Daten an die Konf igurafc ions einheit erfolgt be- 
vorzugt ebenfalls durch Registerstuf en hindureh (1305), bis zum Daten- 
eingangebus der* Konf iguracionseinheit (1302) . 

Die Funktionsweise des Konfiguratigasbusses ist ebenfalls in DE 101 42 
904.5 und de loo 28 397.7 beschrietoen, die zu Of fenba rungs zwecken 
vollumfanglich eingegliedert sind. 

Figur 14 zeigt den Aufbau eines erf iiidungsgemaJSen FIFO-Modells zur 
Steuerung der Rekonf iguration. Diese Einheit ist optional zu alien, ins- 
besondere den in dieser Anmeldungen beschriebenen, rekonf iguierbaren 
Zellen (PAEs) und in Figur 4 als Einheit 0406 dargestellt. 
Ein Speicher 1401 enthalt die Konf igurationsdaten fur die zugeordnete 
PAE. 1402 ist der Konfigurationsdatenausgang zu den Konf igurationsregi- 
stern der PAE (0405). uber 1403. d.h. den Bus 0404, schreibt die Konfi- 
gurationseinheit Konf igurationen in den Speicher, die jeweilige Adresse 
wird durch den Schreibzeiger (1407) generiert, der pro Schreibvorgang urn 
den Wert i ■ver-a.nde^tL wiard, je nacli Arbeitsweise dc*s FIFOs inkrementell 
Oder dekremencell. Bin Startadress-Pointer (1404) zeigt auf den ersten 
Konfiguratioasddbeneiatrag iu» Speicher, wSfrrend ein weiterer Pointer 
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(1405) auf den zu lesenden, bzw. an die PAE zu Ofoertragenden, Konfigura- 
tionsdateneintrag zeigt. 1405 wird mit jeder Datenubertragung aus dem 
Speicher an die PAE um den Wert 1 verandert, je nach Arbeitsweise des 
FIFOs inkrementell oder dekrementell. Die Datenubertragung findet so 
lange statt, bis das Ende der Konf iguration von einer Konf igurationsen- 
deerkennungseinheit (1409) erkannt wird. beispielsweise anhand eines Cy- 
cleBits Oder Befehls (WAIT, END) . 

Der realisierte FIFO entspricht nicht den normalen FIFOs nach dem stand 
der Technik, die nur den Pointer 1405 aufweisen. Die Modifikation ermog- 
licht das Lesen beliebiger Konf igurationsdaten aus dem Speicher, wahrend 
durch den Pointer 1404 verhindert wird, dass evtl. noch ben6tigte Konfi- 
gurationsdaten uberschrieben werden. Dies geschieht durch das Erzeugen 
eines Full-Flags durch den Vergleich (1406) des Startadress-Pointers 
1404 mit dem Schreibzeiger (1407) . wenn der Speicher voll ist, werden 
Schreifoversuche der Konf igurationseinheit zuruckgewiesen, dies kann be- 
vorzugt durch das aus PACTio bekannte ACK/REtf-Protolcoll erfolgen. 
Kin beispielhafter speicher inhalt von 1401 ist mit 1400 gezeigt. Der 
Speicher enthait 5 Konf igurationen (C0..C4). 1404 seigt als Startpointer 
auf die erste Konf iguration CO. In diesem Beispiel zeigt 1405 auf den 
Beginn von Konf iguration C3 . Die Zeigerposition berechnet sich'aus dem 
wert von 14 04 plus der Lange der Konf iguration CO plus der Lange der 
Konfiguracipn ci plus der Lange der Konf iguration ca . 

Eingehende Trigger (1431) werden fiber eine in Figur 14a dargesellte 
ubersetzungs- und auweisungseinrichtung ( 14 32) auf Selekt-Slgnale 
(SC0..n, 1433) iiberseczt, die die Adressierung der Konf igurationsdaten 
im Speicher steuern. 

je ein Register (1411), ein Addierer (1412) und ein Nullgenerator 
(1413). hier beispielhaft realisiert durch eine bitweise Und-Funktion. 
bilden ein Glied ain^ Kette (1414) zur Adressberechnung. Je ein Oiled 
verwaltet den Offset einer Konf iguration. Die Aneinanderreihung der 
Glieder entspricht der Aneinanderreihung der Konf igurationen im Speicher 
1401. Mit anderen Worten wird entsprechend des Beispiels 1408 das erste 
Glied die LSnge der Konfiguration Co aufweisen, also den Offset: der auf 
14 04 addiert werden muss, um auf die Konf iguration Cl zu zeigen. Das 
zweite oiled weist die Lange der Konf iguration Cl auf, also den Offset 
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der auf den Offset von CO und auf 1404 addlert werden muss, urn auf die 
Konfiguration C2 zu zeigen. Das drifcte Glied weist die Lange der Konfi- 
guration C2 auf, also den Offset der auf den Offset von CO und auf dan 
Offset von Cl und auf 1404 addiert werden muss, urn auf die Konfiguration 
5 C3 zu zeigen. Und so weiter. 

Es wird anliand der Ausfuhrung ersichtlich, dass eine Kette von Additio- 
nen entsteht, deren Gliederanzahl der Position der Konfiguration im 
Speicuer entsprlclit. Dies wird durch die Kette 1414 wie folgt reali- 
siert : 

10 uber den Addierer wir jeweils der im Register gespeicherte Wert, also 
die Lange der jeweiligen Konfiguration, zu dem Ergebnis des vornerigen 
Gliedes dazuaddiert. Der Wert am Eingang der bitweisen Und-Funktion wird 
mit alien Ergebnisbits des Addierers verundet . 1st der Eingang also 
gleich 0, liefert die und-Fvuiktion eine Bin&re 0 am Ausgang, urn die Ad- 

15 diererkette bei der auszuwahlenden Konfiguration abzubrechen, aiisonsten 
den Wert des Addierersaus gangs . 

Mit anderen Worten ist in die Register (1411) die Grd£e der Konfigura- 
tionen in ihrer Reihenfolge im Speicher (1401) eingetragen. Die Selekt- 
20 signale sxnd derart auf die Null-Generatoren gefuhrt, dass die Konfigu- 
ration© -Grofcen bis zur Startadresse der duarch die Trigger (1431) refe- 
renzierten Konfiguration auf addiert werden. 

Somit addiert die Kette alle LangexTt von Konf iguxationen, die voir der zu 
25 ladenden Konfiguration im Speicher 1401 liegen. Damit bildet siclx ein 

Offset, der durch Addition (1415) mit der Startadresse (1404) auf die zu 
ladende Konfiguration zeigt . 

Die beschriebene Schaltung ist besonders leistungsf aliig, da sie die. Be- 
30 rechnuxxg des Offsets und den Sprung innernalb eines Taktes ermoglicht. 

In einer zweiten optionalen Kette (1421) kdnnen in Regis tern (1422) Be- 
fehle an die Konf igurationseinheit und/oder die PAE und/oder den Konfi- 
gurationsstack gespeichert werden. Eine Nullfunktion (1423), hier eben- 
35 falls beispielhaf G erxtspz-eahexid der Wullf unkfcion 1413 realisiert, lie- 
fert eine Bin£re o in an ihrem Ausgang, sofern das Selekt-Signal nicht 
akciv ist, d.h. die Konfiguration nicht ausgewahlt wurde, ansonsten den 
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Registerinhalt (1422), also den Befehl. fiber sine Oder-Kette (1424) wer- 
den alle Null-Funktionsausgange miteinander verodert, sodase der Befehl 
im Register 1422 der aktuell selektierten Konfiguration am Ausgang 
(1425) der Kette anliegt. 

Der Befehl kann nunmehr zuin Ldschen von Eintragen im Speicher (14 01) 
dienen. Dies kann z.B. durch den Befehl FLUSH erfolgen, der den Start- 
2eiger (1404) mit dem Lesezeiger 1405 lad und somic alle vor dieser 
Adresse liegenden Daten zuin Oberschreifoen freigibt. 

Weiterhin kann der Befehl tiber das Bussystem nach Figur 13 an die Konfi- 
gurationseinheit geaendet werden (1426) . Beispielsweise kann der Befehl 
dort den Start einer bestimmten Konfiguration auslosen und/oder das Vor- 
laden einer Konfiguration bewirken. 



FLUSH, also das Loschen von Konf igurationen ist einer der wesentlichen 
Befehle der Einheit. Einerseits 1st der Befehl wesentlich fur die Aus- 
fuhrung, andererseits weist er das Problem auf, dass Sich bei dessen 
Ausftthrung samtliche Adressen und Referenzen verandem. 

Der FIFO wird "gef lushed", indem der StartPointer (1404) auf eine neue 
Startadresse geeetzt wird. Diese wird wie in Fig. 14 dargestellt bevor- 
zugt auf den Beginn einer gespeicherten Konfiguration gesetzt, wobei der 
Beginn durch die vorab beschr-iebene Berechnung mittels des Offsets be- 
stinmit wird. Alcernativ oder zusatzlich kann der Zeiger aueh auf einen 
bestimmten anderen Wert z.B. eine an den FLUSH-Bef ehle gekoppelte Kon- 
25 stance gesetzt werden. 

Weiterhin mussen die beiden Ketten 1414 und 1421 "geflushed" werden, da- 
mit die Adressberechnung der geanderten Positionen der Konf igurationen 
im speicher 1401 entspricht. Dies geschieht jeweils durch (in Figur 14 
nicht eingezeichnete) Multiplexer (1451) , durch die die Regis terdaten 
derart vorwartsiibertragen werden, dass die nunmehr leeren ( "gef lushten" ) 
Glieder der Kette mit den Daten der nachf olgenden Glieder uberschrieben 
warden, und zwar derart, dass a) die Reihenfolge der Daten in der Kette 
unverandert bleibt und b) das erste Glied der Kette mit neuen Daten be- 
legt ist und c) alle weiteren Daten in ihrer Reihenfolge linear und ohne 
I,ueke in die Gliede* nachfolgead dem Epsten geschrieben sind. 
Durch die Verschiebung innerlialb der Ketten sind nunmehr die Selekt- 
signale (SC0..n) an die neue Lage der Daten in den Ketten anzupassen, 
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damit wilder eine korrekte Zuordnung der Selekt-Signale zu der Offsetbe- 
rechnung exits teht. 

Grundsatzlich stehe dazu mehrere Mathoden zur Verfugung- Beispielswei3e 
kdnnen 

5 a) Signale nach 143 2 in 1434 binar kodiert (entsprechend der Funktion 

eiues 74Lsi48) werden, ein offset, der der durch Flush entstandehen Ver- 
schiebung entspricht, wird subtrahiert und der entstandene Were wird 
wieder dekodiert (entsprechend der Funktion eines 74IiS139) urn die Se- 
lekt-Signale 1433 zu generieren,- 

0 b) Signale nach 1432 in 1434 raittels einer Lookup-Tabelle auf die Se- 
lekt-Signale 1433 ubersetzt werden. Dazu ist die Lookup -Tabe lie der 
durch Flush veranderten Positionslage in den Ketten anzupassen. 




Bin besonders bevorzugtes Verfahren fur die Ubersetzung der Signale soil 
15 detailliert beschrieben werden und entspricht der in 1434 eingezeichne- 
ten Vorrichtung: 

Bin erstes schieberegister (1435) enthalt als einen Ein-Bit-Wert die Po- 
sition des aktuell erst en freien, also unbenutzten, Gliedes in den Ket- 
ten 1414, 1421. Dies geschieht f olgendermafien = Nach einem Reset wird das 

20 niederwertigste Bit iti\ Schieberegister auf 1 gesetzt (dargestellt durch 
einen gefullten Kreis) . Das niederwertigste Bit (Bit 0) wird auf das un- 
terste Glied in den Ketten ref erenziert . Mit jedem SclireiJbzugrif f auf 
die Ketten, also rait jedem neuen speichern (FILL) einer Konf iguration 
nach 1401 schiebt das Schieberegister das gesetzte Bit (PBIT) um eine 

25 Position in Richtung des hochstwertigen Bits und ref erenziert damit auf 
das jeweils nachfolgende Glied in den Ketten. Das hochstwertige Bit re- 
ferenziert somit auf das hochste Glied in den Ketten, also ist das 
Schieberegister so breit wie Glieder in den Ketten vorhanden sind. Mit 
jedem FLUSH schiebt das Schieberegister das Bit (PBIT) um genau so viele 

30 Poeitionen wie Glieder in den Ketten geloscht wurden in Richtung des 
niederwertigen Bits. 



Die Ubersetzungs- und Zuweisungseinrichtung (1432) ubersetzt bei der PAE 
vom Bussystem (0105a, Fig. 4) eingehende Trigger derart, dass je Trigger 
ein gex*avi ein Signal des auageh^ndew Busses (1437) gesetzt ist. Jedem 
Signal ist ein Schieberegister (1436) derselben Gr6£e wie 1435 zugeord- 
net. Beim neuen Speichern einer Konf iguration (FILL) wird der Inhalt von 
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1435 vor dem Verschieben -von PBIT in das Scheiberegister (1436) ge- 
schrieben, auf das der, der Konf iguration zugeordnete, digger zeigt; 
dargestell durch einen Kreis. 

Bei einem Auftreten des Triggers auf dem Bus, liefert da© entsprechende 
ubersetzte Signal (1437) einen l-wert, wahrend alle anderen Signale ei- 
nen O-Wert lief era. Die Signale 1437 werden jeweils an Nullgeneratoren 
(1438), aufgebaut aus einer bitweisen Und-Funktion gefuhrt. Alle Nullge- 
neratoren deren Eingangs signal von 1437 einen o-Wert aufweist, liefern 
einen Nullvektor am Ausgang. Der Null generator, dessen Eingangs signal 
von 1437 einen 1-Wert aufweist, ubertragt den Inhalt des Schieberegi- 
sters 1436. Die Auegange aller NUllgeneratoren werden miteinander vero- 
dert (1433), sodass die Selekt-Signale SCO.-n (1433) entstehen. 

Durch diese Funktion zeigt nunmehr ein eingehender Trigger uber die 
Nullfunktionen auf ein Schieberegister 1435, dessen gesetztes Bit wie- 
derum auf ein Glied in der Ketten (1414, 1421) zeigt - 

Bei einem Plush schieben die Schieberegister 1436 gleich dem Schiebere- 
gister 1435 den gespeicherten Wert urn genau so viele Positionen wie 
Glieder in den Ketten geldscht wurden in Richtung des niederwertigen 
Bits. 1st nach dieser Operation der Inhalt eines Schieberegisters gleich 
Null, da das PBIT uber das niederwertigste Bit hinausgeschoben wurde, 
bedeutet dies, dass die vormals referenzierte Konf iguration geldscht 
wurde - 

Liefert 1434 f\ir einen eingetrof f enen Trigger 1431 den Wert Hull am Aus- 
gang 1433, ist eine Konf igurationsauf forderung an die Konf igurat ions ein - 
heit zu senden, um die fehlende Konf iguration zu laden oder ggf . . auch 
ein Fehlerstatus an die Konf igurat ions einhe it zu meldeu. 

Die Ubereeczung aer eingehenden Trigger 1431 naoh 1437 in 1432 kann naah 
mehreren Priuaipien erfolgend, die einzeln Oder gemeinsam angewendet 
werden konnen, beispielsweise : 

1. Dekoder entspreehend der Funktion eines 74LS148 

2. Hound-Robin Arbiter (vgl. pac'A'IQ) 

3. Iioolcup-Tabelle (vgl. PACT10) 
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Prinzipiell kann die Ubersetzung dem in PACT10 beschriebenen Verfahren 
entsprechen (Round- Robin- Arbiter, LUT1) . 

Fehlt eine Ubersetzungsvorschrif t, beispielsweise bei der Anwendung von 
Lookup -Tabellen, ist eine Konf igura t ions auf for derung an die Konf igurati- 
5 onseinheit zu senden, urn die fehlende Konf igura t ion zu laden Oder ggf . 
auch ein Fehlerstatus an die Konf igurationseinheit zu melden. 

Bine weitere wesentliche Funktion des Konf igura t ions stacks nach Figur 14 
ist das Sequenzen uber Konf igura tionen, v/as bedingte und unbedingte 
10 Sprunge innerhalb des Speicliers 1401 bedeutet. Daher ist auch diese 
Funktion detailliert in Figur 14b beschrieben. 

Ein Befehlsdekoder (1462) erkennt bedingte und unfoedingte Sprungbefenle 
in Konfigurationsworten (1402) foeim Lesen aus dem Speicher 1401 , Einem 
Sprungbefehl ist als Konstante die relative Sprungadresse zur aktuellen 
Position zugeordnet, die vom Bef ehlsdekoder dekodiert und ausgegeben 
wird (1463) . Je naclx Sprungrichtung ist der Wert positiv oder negativ. 
Weiterhin ist als Konstante ein Vergleichswert (1469) mit den eintref ~ 
fenden Triggem oder den Statusflags der PAE, beispielsweise die ALU- 
Flags zero, carry, negative, overflow, etc. oder die Speicher- Flags 
full, empty, etc., angegeben, in Abhangigkeit dessen bedingte sprunge 
durchgefiinrt werden. Diese wird an eine Vergleichseinlieit 1464 ubermit- 
telt, die den Wert mit den Flags (1465) und/oder Triggern, die von dem 
Augang Ubersetzungs- und Ztoweisungseinrichtung (1437) und/oder direkt 
von dem Bussystem 0105 stammen, verglichen. 
25 Eine Steuereinheit (1466) generiert in Abhangigkeit des Befehles (bedin- 
ger oder unbedingter Sprung « "Type") und des Vergleichsergebnisses die 
Ansteuerung fur den Lesezeiger (1405) wis f olgt : 

Unbedingter Sprung: Generiere "Set", urn neue Adresse nach 1405 zu laden; 
BQdingter Sprung, Vergleich erfiillt: Generiere "Set", urn neue Adresse 
30 nach 1405 zu laden; 

Bedingter Sprung, Verglaicn nicht erfttllt: Generiere "Count", urn Adresse 
des nackfolgenden Befehles in 1405 zw berechuen. 

Das Setzen einer neuen Adresse geschieht durch aufaddieren (3,468) der 
35 relatives Sprungadresse (1463) sura aktuellen Wert von 1405. Uber einen 
Multiplexer (1467) , der zwischen der aufaddierten neuen Adresse und der 
von 1415 generierten Startadresse von Konf igurationen (1461) auswahlt, 
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wird die ueue Adress bei Anliegen von "Set" in den Lesepointer 1405 ge- 
schrieben. 

Die Arfoeitsweise dss Konf igurationstacks macht die Verwendung von Konfi- 
gurationseinheiten (CT) wie aus PACT10 und PACT 17 bekannt weitgehend obo- 
solet, vielmehr ist eine verteilte, parallele CT durch die Konfigurati- 
onsstacks entscanden. 

Zwei wesentliche Aufgaben der CT verbleiben: 

1. Das Laden der Konf igurationen aus einem Speicher, der chipintern oder 
-extern iraplementiert sein kann, als fluchtiger oder nicht fluchtiger 
(ROM, EPROM, EEPROM, Flash-ROM, etc) Speicher ausgestaltet sein kann 
und/oder ein Massenspeicher sein kann. Dies kann nunmehr durch einen ein- 
fachen Mikrokontroller erfolgen, der Oaten an die PAEs sendet und auf die 
zurtickgemeldete Quittierung reagiert. Beispielsweise kann bevorzugt die 

15 Einheit aus PACT 05 als Mikrokontroller bzw. der in PACT 05 beschriebene 
Algorithmus eingesetzt werden. 

2. 1st sicherzustellen, dass Rekonf igurationstrlgger (WCT) in einer be- 
stimmten Reihenfolge sortiert durch das Array laufen. Sofern nur ein Re- 
kbnfigurationstrigger verwendet wird, sind keine besonderen MaUnahroen 
erforderlich. Wenn raehrere Rekonf igurationstrlgger (WCT) auftreten k5n- 
nen, mUssen diese ohne zeitliche Oberlagerung, also nacheinander in fe- 
ster Reihenfolge und kreuzungsfrei durch das Array laufen, um Deadlocks 
zu verhindern. 

Die kann durch das in Figur 16 dargestellte Verfahren sichergestellt wer- 
den, bei welchen durch Routing-Mafinahmen fur eine korrekte zeitliche Wei- 
terleitung von WCT zu sorgen. Von einer zentralen Instanz (1603) werden 
mehrere WCT far verschiedene PAEs (1601) generiert, die jedoch zeielich 
aufeinander abgestiinint sein sollen. Die unterschiedlichen Entfernungen 
der 1601 in der Matrix fuhren zu unterschiedlichen Laufzeiten, bzw. La- 
tenzzeiten. Dies wird in dem vorliegenden Beispiel durch das geeignete 
Einsetzen von Pipelineatuf en (1602) durch den, den, Compiler zugeordnetsn 
Router, erreicht (vgl. PACT13) . Die sich dadurch ergebenden Latenzen sind 
mit dl-d5 angegeben. Es ist ersichtlich, daJA in Richtung des WCT-Flusses 
(1604) in jeder Stufe (Spalte) dieselben Latenzen auftreten. Beispiels- 
weise ware 1605 nicht notwendig, da die Entfernung von 1606 von 1603 sehr 
gering ist. Da aber far 1607 und 1608 je ein 1602 aufgrund der durch die 
langere Distanz entstehenden Laufzeit eingefugt werden muB, wird 1605 zum 
Abgleich der Laufzeit notwendig. 
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Die zentrale instanz 1603 nimmt von den PAEs eingehende Rekonfigurati- 
onstrigger (1609) auf und priorisiert diese, urn sie dann jeweils einzeln 
und naoheinander als WCT an das Array aus PAEs zu senden. Mic andez-en 
Worten sendet eine PAE, die einen RekoriJEigur at ions trigger generiert, 
diesen nicht direkt an andere PAEs weiter, sondem ausschliefilich. an die 
zentrale inscarxa 1603. 

Die zentrale Instanz speicherc eingehende Trigger und priorisiert diese. 
Dazu kann bevor2ugt das aus PACT10 bekannt verfahren des 5CRR-ARB ver- 
wendet werden, wie es in Figur 8 PACT10 ausfuhrlicli beschrieben ist. 

BeXiebige weitere Ausgestaltungen und Kombinationen der erlauteruen Er- 
findungen sind moglich und einem Fachmann of fensichtlich. 

Samtliche erwahnten PACT-Patentanmeldungen sind zu Of f enbarungszwecken 
vollumfanglicli eingegliedert . 
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5 Patentanspruche 

1. Zellementefeld zur Datenverarbeitung mit Funk t ions zellen zur Ausfuh- 
rung algebraischer und/oder logischer Funktionen und Speicherzellen, 
um Information zu empfangen, abzuspeichern und/oder auszugeben, da- 

10 durch gekennzeichnet, da& vou den Funktionszellen eine Steuerverbin- 

dung zu den Speicherzellen gefuhrt ist. 

2. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeich- 
net, da£ ein Prozessor, Coprozessor und/oder Microcontroller mit ei- 

15 ner Vielzahl in Funktion und/oder Vernetzung rekonf igurierbarer 

und/oder vorgebbarer Einlxeiten wie Funktionszellen und/oder Speicher- 
zellen bildet- 

3. Zellementefeld nach einem der vorhergehenden Anspruche, dadurch ge- 
20 kennzeichhet, dafi die Funktionszellen als arithmetische kogikeinhei- 

ten gebildet sind. 

4 . Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeich- 
net, daH die arithmetischen Logikeinheiten als erweiterte ALUs gebil- 

25 det sind. 

5. Zellementefeld nach einem der vorhergehenden Auspruche, dadurch ge- 
kennzeichnet, dafi die Speicherzellen zur fluchtigen und/oder nicht 
fluchtigen Datenspeicherung ausgebildet sind- 



30 



35 



Zellementefeld nach einem der vorhergehenden Arxspruche, dadurch ge- 
kennzeichnet, daS die speicherzellen zur Abspeicherung von zu verar- 
beitenden Daten und/oder von zu verarbeitendexx Programmschritten aus- 
gebildet sind. 

Zellementefeld zur Datenverarbeitung, dadurch gekennzeichnet , daS die 
Speicherzellen dazu ausgebildet sind, abgespeicherte Inf ormationen 
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auf Ansteuerung der sie steuernden Funktionszelle direkt und/oder in 
direkt auf einen zur Funktionszelle fuhrenden Bus zu geben. 

8. zellementefeld nach einem der vorhergehenden Anspriiche, worin zumin- 
5 dest einer Speicherzelle und/oder Funktionszelle Register zugeordnet 

sirid, insbesondere ein Backward-Register, welches im Inf ormationsweg 
zwischen Speicherzelle und Funktionszelle angeordnet isc. 

9. zellementefeld nach einem der vorhergehenden Anspruche, dadurch ge- 
10 kennzeichnet/ daS die Speicherzelle dazu angeordnet ist, Informatio- 

nen von der sie steuernden Funktionszelle, einer Eingabe-Ausgabe- 
Zelle und/oder einer sie nicht steuernden Zelle mit arithmetischer 
Logikeinheit zu empfangen. 

15 10. Zellementefeld nach einem der vorhergehenden Anspruche, dadurch ge- 
kexinzeichnet, da£ der Funktionszellen-speiclierzellen-Kottibination zu- 
mindest ein Ein-Ausgabe-Mittel zugeordnet ist, urn Inf ormationen an 
eine externe Einheit und/oder eine andere Funktionszelle/ Funktions- 
zelleri-Speicherzellen-Kombination und/oder Speicherzelle zu senden 

20 und/oder von dieser zu empfangen. 

11. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekenn- 
zeichhet, da£ das Ein-Ausgabe-Mittel gleichfalls zuni Empfang von 
steuerbefehlen aus der Funktionszelle ausgebildec ist. 



12. Zellementefeld nach einem der vorhergehenden Anspruche, dadurch ge- 
kennzeichnet, da£ die Steuerung dazu ausgebildet ist, zumindest ei- 
nige r bevorzugt alle der nachf olgenden Befehle zu ubertragen 
und/oder die Speicherzelle bzw, Eingabe/Ausgabe- Zelle dazu ausgebil 
dec ist, die f olgenden Befehle zu dekodieren: DATA WRITE/READ., 
ADRESS POINTER WRITE/READ, PROGRAMMPO INTER WRITE/READ, PROGRAMMPOIN- 
TER INCREMENT, STACKFOINTER WRITE /READ , vorgenannte Befehle jeweils 
insbesondere fur iaternen und/oder exteraen Zugriff , PUSH, POP, OP- 
CODE, FETCH. 

13. Zellementefeld nach einem der vorhergehenden Anspruche, dadurch ge- 
kennzeichnet, da£ die Funktionszelle als alleiniger Master auf die 
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Steuerverbindung und/oder das als Steuerungsverbindung dienende Bus- 
segment zugreifen kanri. 




14. Zellementefeld zur Datenverarbeitung nach einem der vorhergehenden 
Anspruche, dadurch gekennz eichnet, daS die Funktionszelle zumindest 
eixier von Speicherzelle und Ein-Ausgabezelle benachbart angeordnet 
ist . 



10 



15 



20 



25 



15. Zelleraentefeld nach einem der vorhergehenden Anspruche, dadurch ge- 
kennzeichnet, dafi die Zellelemente multidimensional angeordnet sind, 
insbesondere inatrixartig, wobei die Funktionszelle und/oder die be- 
nachbarte Speicher- bzw, Ein-Ausgabezelle aus einer oberen Raihe Da- 
ten empfangen und in eine untere Reihe Daten ausgeben kann, wobei in 
einer Reihe Busse vorgesehen sind urid die Funktionszelle und zumin- 
dest eine Speicher- und/oder Ein-Ausgabezelle in ein und derselben 
Reihe liegen - 



is. Verfahren zum Betrieb eines Zellelementefeldes, insbesondere multi- 
dimensional en Zellelementef eldes mit Punktionszellen zur Ausfuhrung 
algebraischer und/oder logischer Punktionen und Inf ormationsbereit- 
stellungszellen, insbesondere Speicherzellen und/oder Ein- 
Ausgabezellen zum Empfangen und/oder Ausgeben von Inf orrnationen 
und/oder Speichern derselben, dadurch gekennz eichnet, dafi zumindest 
eine der Funktionssellen Steuerbef ehle an zumindest eine Informati- 
onsfoereitstellungszelle ausgibt, dort im Ansprechen auf die Steuer- 
bef ehlinformation far die Funktionszelle verarbeitet wird und die 
Funktionszelle dazu ausgebildet ist, eine weitex^e Datenverarbeitung 
im Ansprechen auf aus der inf onnationsbereitstellungszelle bereitge- 
stellte Information durchzufuhren, urn so sec[uen2erartig Daten zu 
30 verarbeiten. 

17. Verfaliren nach einem der vorhergehenden Anspruche, dadurch gekeun- 

zeichnet, dafi die Funktionszelle dazu ausgebildet ist, zumindest ei- 
nige der Steuerbef ehle 
35 OPCODE FETCH, 

DATA WHITE INTERN, 
DATA WRITE EXTERN, 
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DATA READ INTERN", 



DATA READ EXTERN, 



15 



10 



ADRESS POINTER WRITE INTERN, 
ADRESS POINTER WRITE EXTERN, 
AD RES S PO INTER READ INTERN, 
ADRESS POINTER READ EXTERN, 
PROGRAMMPO INTER WRITE INTERN, 
PROGRAMMPOHSTTER WRITE EXTERN, 
PROGRAMMPO INTER READ INTERN, 
PROGRAMMPO INTER READ EXTERN, 
STACKPO INTER WRITE INTERN, 
STACKPOINTER WRITE EXTERN, 
STACKPO INTER READ INTERN, 
STACKPO INTER READ EXTERN, 
PUSH, 



POP, 

PROGRAMMPO INTER INCREMENT 

ausgibt und im Laufe Zellementbetriebs zumindest einige, insbesonde- 
re alle der oben genannten Steuerbef ehle wie erf orderlich ausgibt. 



18. Datenverarbeitungsanordnung mit einem multi dimensional en 
Feld 

in Funktion und/oder Vernetzung konf igurierbarer zellelemente und 
25 diesen zugeordneten Konf igvurat ions vorhalt emit teln zum lokalen Kon- 

f igura t ions - voirhal ten , 

dadurcli gekennzeichnet , d a £ 
die Konfigurationsvorhaltemittel dazu ausgebildet sind, 
zumindest einen Teil der vorgehaltenen Konf igurationen 
30 nichtf luchtig vorzuhalten. 

19. Dahenverarbeltungsanorduung mit einem multidimensionalexi 



Feld 

in Funktion und/oder Vernetzung konf igurierbarer Zellelemente und 
diesen zugeordneten Kon£igurationsvo37hciltemitteln zum lokalen Kon- 
f iguira t ions - Vorfta 1 U en , 

d a d u r c h gekennzeichnet, d a £ 



20 
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die Konfigurationsvorhaltemittel dazu auagebildet sind, 
zumindest einen Teil der vorgehaltenen Konf igurationen 
nichtf luchtig vorzuhalten. 

5 20. Datenverarbeitungsanordnung nach einem der vorhergehenden Datenver- 
arbeitungsanordnungsauspruche, dadurch gekennzeichnet, da£ die Funk- 
tion grobgranular konf igurierbar ist. 



21. Datenverarbeitungsanordnung nach einem der vorhergehenden Datenver- 
arbeitungsanordnungeanspruche, dadurch gekennzeichnet, da£ die ver- 
netzung grobgranular konf igurierbar ist. 



22 . Datenverarbeitungsanordnung nach. einem der vorhergehenden Datenver- 

arbeitungsanordnungsanspruche, dadurch gekennzeichnet, da£ als zel- 
lelemente zumindest eines von ALUs, EAlUs, RAM-Zellen, X/0-2ellen, 
IjOgibl6cken vorgesehen sind. 

23 . Datenverarbeitungsanordnung nach einem der vorhergehenden Datenver- 

arbeitungsanordnungsanspruche, dadurch gekennzeichnet, da£ jedem 
Zellelement ein eigenes Konfigurationsvorhaltemittel zugeordnet ist. 



24. Datenverarbeitungsanordnung nach einem der vorhergehenden Datenver- 
arbeitungsanordnungsanspriiche, dadurch gekennzeichnet, daS die Koiv 
f igurationsvorhaltemittel dazu ausgebildet sind, eine Vielzahi von 

25 Konf igurationen vorzuhalten. 

25. Datenverarbeitungsanordnung nach einem der vorhergehenden Datenver- 
arbeitungsanordnungsanspruche, dadurch gekennzeichnet, daJS mehrere 
fest vorgegebene nichtf Ittchtige Konf igurationen im Konf igurations- 

30 vorlialtemittel vorgegeben sind. 



25. Datenverarbeitungsanordnung nach einem der vorhergehenden Datexiver- 
arbeitungsanordnungsanspruche, dadurch gekennzeichnet, dafi die An- 
ordnung dazu ausgebildet ist, eine wechselnde einer Vielzahl von 
vorgehaltenen Konf igurationen zu verwenden, insbesondere im Wege der 
Wave-Rekonf iguration Oder des lokalen Sequencing. 
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27. Datenverarbeitungsanordnung nach einem der vorhergehenden Daceriver- 
arbeitungsanordnungsanspiruche, dadurch gekennzeichnet , da£ bei eini- 
gen Zellen im Betrieb mit veranderlichen Konf iguratiouen versehbare 
Konfigurationsvorhaltemittel vorgeseuen sind. 

28. Datenverarbeitungsanordnung nach einem dear vorhergehend«n Datenver- 
arbeitungsanordnung sans pruch^ dadurch gekennzeichnet , dafc als Kon- 
figurationsvorhaltemittel zunmindest eines aus ttOM, EPROW, EEPROH, 
Flash-Speicher, Fuse-, Antifuse-programmierbare Speichermittel 
und/oder in insbesondere in oberen Lagen einer Siliziumstruktur fest 
vorgesehene Speichexroittel gewahlt sind. 



15 



20 



25 



30 



35 



29. Verfahren zur Herstellung einer dedizierten Datenverarbeitungsan- 

ordnung, dadurch gekennzeichnet, daS ein mulcidimensionales Feld mit 
in Function und/oder Vernetzung konf igurierbaren Zellelemente und 
diesen zugeordneten Konf igur at ions vor halt emit te In zum lofcalen Konfi- 
gurat ions -Vorhal ten vorgegeben wird, bestimmt wird, welche Konfigu- 
rationen in diesen vorzuhalten sind, und dann nichtf luchtige Konfi- 
gurationsvorhaltemittel so vorgesehen werdea, daS sie zumindesc ei- 
nen Teil der vorgehalterien Konf igurationen nichtf luchtig vorhal ten. 



30. 



31 



Verfahren nach dem vorhergehenden DatenverarbeitungsanorcUiuiigsan- 
spruch, dadurch gekennzeichnet, dafi von einem zur lauf zeitrekonfigu- 
rierbaren multidimensional en Feld ausgegangen wird. 



Verfahren nach dem vorhergehenden Datenverarbeitungsanordnungsan- 
spruch, dadurch gekennzeichnet, da£ zunaehsc von einem zur laufzeit- 
rekonf igurierbaren multidimensional en Feld mit Rekonf igurationsbe- 
schaltung ausgegangen wird und dann fur Reconfiguration nichtbeno- 
tigte Felder weggelassen werden. 
32. Datenverarbeitungsanordnung, insbesondere nach einem der vorherge- 
henden Anspruche, insbesondere Prozessor, mit einem Feld aus zur 
Xaaufzeit in Funktion und/oder Vernetzung datenverabeitenden rekonf i- 
gurierbaren Zellen. denen Speicher uxxd eine Sequenzersteuerung zuge- 
ordnet ist, dadurch geJcennseichnet , da£ die steuerung derart ausge- 
bildet ist, dalS sich tin vollstandiger uud/oder limitierter Befehs- 
satz ergibt. 
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33- Datenverarbeitungsanordnung, insbesoadere nach einem der vorherge- 
henden Anspruche, insbesondere Prozessor, mit einem Peld a us zur 
Laufzeit in Funktion und/oder Vernetzung datenverabeitenden rekon- 
f igurierbaren Zellen, rait einer ALU Oder anderen logischen Verknfcp- 
fungsbeschaltung und dieser zugeoz*dnetem, insbesondere integriertem 
speicher, dadurch gekennzeichnet, daK der Speicher in einer anderen 
Halbleiter-Lage, insbesondere oberhalb der ALU Oder anderen logi- 
schen Verknupfungsbeschaltung angeordnet ist. 

34. Datenverarbeitungsanordnung, insbesondere nach einem der vorherge- 
henden Anspruche, insbesondere Prozessor, mit einem Feld aus zur 
Laufzeit in Funktion und/oder Vernetzung datenverabeifcenden rekon- 
figurierbaren Zellen, von denen einige Speicherzwecken dienen, da- 
durch gekennzeichnet, da£ diese Zellen dazu ausgebildet sind, eine 
MMU und/oder DMA - Funktion zu realisieren. 



Datenverarbeitungsanordnung, insbesondere nach einem der vorherge- 
henden Anspruche, insbesondere Prozessor, mit einem Feld aus 2rur 
Laufzeit in Funktion und/oder Vernetzung datenverabeitenden rekon- 
figurierbaren Zellen, dadurch gekennzeichnet, dafc zumindest einige, 
bevorzugt nicht alle, Zellen eine Eingangs/Ausgangsfunktion reali- 
sieren und bevorzugt zugleich eine ALU oder anderen logischen Ver- 
knfcpfungsbeschaltung zur Datenverarbeitung und/oder -veranderung 
aufweisen. 

Datenverarbeitungsanordnung, insbesondere nach einem der vorherge- 
henden Anspruche, insbesondere Prozessor, mit einem Feld aus zur 
Laufzeit in Funktion und/oder Vernetzung datenverabeitenden rekon- 
figurierbaren Zellen, dadurch gekennzeichnet, dafc zumindest einige, 
bevorzugt nicht alle, Zellen f eingranulare FPGA-Strukturen aufwei- 
sen, wahrend andere Zellen grobgranulare Strukturen aufweisen. 

Dacenverarbeitungsanordmmg nach dem vorhergehenden Anspruoh, wobei 
eine Konf igurationseinheit zur schnellen Rekonf iguration der Zellen 
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vorgesehen ist, dadurch gekennzeichnet , dafc die Konf igurationsein- 
heic nur zur Konf iguration der grobgranularen und/oder der Itficht- 
FE>GA~Zellen beschalcet iet. 



10 



38. Datenverarbeitungsanordnung, insbesondere nach einem der vorherge- 
henden Ansprilche, insbesondere Prozessor, mit einem Feld aus zur 
Lauf zeit in Funktion und/oder Vemetzung datenverabeitenden rekon- 
figurierbaren zellen zur Verarbeitung von Daten mit einer hoheren 
Bitbreite, dadurch gekennzeichnet , da£ die Zellen dazu ausgetoildet 
sind, wahlweise Daten mit einer hoheren Bitbreite Oder Daten mit 
geringerer Bitbreite zu verarbeiten, wobei dann mehrere Daten mit 
geringerer Bitbreite simultan verarbeitbar sind, insbesondere nach 
Art eines SIMD-Rechenwerkee . 

15 39. Datenverarbeitungsanordnuxxg, insbesondere nach einem der vorherge- 
henden Ansprflche, nach dem vorhergehenden Anspruch, dadurch gekenn- 
zeichnet, da£ zur Zelle bin Oder von dieser weg fuhrende Busse 
teilbar sind, insbesondere urn mehrere Datenstrome mit geringerer 
Bitbreite ale der in der Zelle maximal bearbeitbaren Bitbreite un~ 
abhangig weiterleiten und/oder empfangen zu kdnnen. 



20 



40. 



25 

41. 



Datenverarbeitungsanordming, insbesondere nach einem der vorherga- 
henden Anspruche, nach dem vorhergehenden Anspruch, .dadurch gekenn- 
zeichnet, dafc die Busverwaltung lokal in der Zelle erfolgt, 

Datenverarbeitungsanordnung insbesondere nach einem der vorherge- 
henden Ansprttche, dadurch gekennzeichnet , da£ einer PAE ein spei- 
cher zur Sequenserrealisierung zugeordnet 1st und die Adressbusse 
als Teiladresbusse auf teilbar sind.. 
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